Langfuse の Observation レベル評価:「どのステップが悪いのか」をスコアで特定できるようになった2026年2月26日·4 分Langfuse LLM評価 RAG LLM-as-a-Judge オブザーバビリティこんにちは。ガオ株式会社の黒澤です。 Langfuse v3.153.0 で [PR #11861 ](https://github.com/langfuse/langfuse/pull/11861 ) がマージされ、LLM-as-a-Judge を Observation 単位で実行できるようになりました。本記事ではその背景と使い方をまとめます。
もうRAG評価で迷わない!Ragas最新メトリクス解説と実践的改善ガイド2025年10月2日·11 分Langfuse RAG Ragas GenAIOpsはじめに # RAG(Retrieval-Augmented Generation)は、外部知識を参照してLLMの回答精度を向上させる強力な技術です。
Langfuseでの可視化 [Dify編 (後半) ]2025年1月20日·5 分Langfuse Dify 可視化 RAG LLMOps更新日:2025年5月23日 本記事ではDify で作ったLLMアプリケーションをLangfuse で可視化してみた時に、処理はどう見えるのか、そしてどのように役に立つのかをご紹介します。