<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI on GAO AI Blog</title><link>https://blog.gao-ai.com/tags/ai/</link><description>Recent content in AI on GAO AI Blog</description><generator>Hugo -- gohugo.io</generator><language>ja</language><copyright>© ガオ株式会社 All Rights Reserved.</copyright><lastBuildDate>Mon, 01 Jun 2026 16:30:00 +0900</lastBuildDate><atom:link href="https://blog.gao-ai.com/tags/ai/index.xml" rel="self" type="application/rss+xml"/><item><title>DeepTeam で RAG にプロンプト攻撃を投げてみた</title><link>https://blog.gao-ai.com/posts/deepteam-redteam/</link><pubDate>Mon, 01 Jun 2026 16:30:00 +0900</pubDate><guid>https://blog.gao-ai.com/posts/deepteam-redteam/</guid><description>&lt;h2 class="relative group"&gt;概要
 &lt;div id="概要" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%a6%82%e8%a6%81" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;DeepTeam は LLM アプリの脆弱性を自動で突きにいく OSS（Confident AI 製、DeepEval の兄弟）&lt;/li&gt;
&lt;li&gt;50+ の脆弱性カテゴリと多数の攻撃手法（バージョンにより増減）を組み合わせてくれるので、自分で攻撃プロンプトを考えなくていい&lt;/li&gt;
&lt;li&gt;Acme 社という架空のヘルプデスク Bot にプロンプトインジェクション × 3 をぶつけたら、Gemini 2.5 Flash + 短いシステムプロンプトで &lt;strong&gt;今回の 3 ケースでは漏洩なし (Mitigation 100%)&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;Langfuse に &lt;code&gt;@observe&lt;/code&gt; + &lt;code&gt;create_score&lt;/code&gt; を入れるだけで、攻撃シミュレーションの結果が &lt;strong&gt;時系列ダッシュボード&lt;/strong&gt; になる&lt;/li&gt;
&lt;li&gt;単発の CLI 結果で終わらせず、&lt;strong&gt;Trace・Score・Session として保存して PR ごと・リリースごとに差分を追える状態&lt;/strong&gt;を作るのが本記事のゴール&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 class="relative group"&gt;1. DeepTeam とは
 &lt;div id="1-deepteam-とは" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#1-deepteam-%e3%81%a8%e3%81%af" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.trydeepteam.com/" target="_blank" rel="noopener noreferrer"&gt;DeepTeam&lt;/a&gt;
 は、LLM アプリに対する &lt;strong&gt;攻撃シミュレーション&lt;/strong&gt;（英語圏では &amp;ldquo;red teaming&amp;rdquo;）を自動化するフレームワークです。評価フレームワーク &lt;a href="https://deepeval.com/" target="_blank" rel="noopener noreferrer"&gt;DeepEval&lt;/a&gt;
 の兄弟プロダクトで、Confident AI が出しています。&lt;/p&gt;</description></item></channel></rss>