評価フレームワーク Inspect AI で、AI エージェントの安全性を評価してみた2026年5月8日·10 分Inspect AI Inspect Evals Agent Langfuse Vertex AI LLM評価はじめに # LLM の安全性やガードレールは、サービスごとに説明が分かれ、一国の政府が横断的に示す「公式の基準やルール」がすぐ手元にあるわけではありません。評価を第三者が検証したり、同じ手順を繰り返したりするには、文章だけでは足りない場面があります。