メインコンテンツへスキップ

Agent

評価フレームワーク Inspect AI で、AI エージェントの安全性を評価してみた

はじめに # LLM の安全性やガードレールは、サービスごとに説明が分かれ、一国の政府が横断的に示す「公式の基準やルール」がすぐ手元にあるわけではありません。評価を第三者が検証したり、同じ手順を繰り返したりするには、文章だけでは足りない場面があります。