評価フレームワーク Inspect AI で、AI エージェントの安全性を評価してみた2026年5月8日·10 分Inspect AI Inspect Evals Agent Langfuse Vertex AI LLM評価はじめに # LLM の安全性やガードレールは、サービスごとに説明が分かれ、一国の政府が横断的に示す「公式の基準やルール」がすぐ手元にあるわけではありません。評価を第三者が検証したり、同じ手順を繰り返したりするには、文章だけでは足りない場面があります。
【入門編】Langfuseで画像OCRの精度検証をシンプルに始める方法2026年1月26日·7 分Langfuse OCR LLM評価 Vertex AI Gemini PythonGeminiの性能向上によりOCRは実用的になりましたが、高精度を目指すならプロンプト調整は必須です。しかし、調整のたびに画像と結果を目視で見比べるのは、手間がかかりミスも誘発します。
【実践】Model ArmorでVertex AIのAIセキュリティを実装する2025年9月12日·7 分Langfuse Google Cloud Vertex AI Model Armor AI SecurityAIアプリのセキュリティ問題について # AIを利用したアプリケーションが急速に普及する一方で、悪意あるプロンプトでAIをハッキングしようとする動きも出てきています。