<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Human Annotation on GAO AI Blog</title><link>https://blog.gao-ai.com/tags/human-annotation/</link><description>Recent content in Human Annotation on GAO AI Blog</description><generator>Hugo -- gohugo.io</generator><language>ja</language><copyright>© ガオ株式会社 All Rights Reserved.</copyright><lastBuildDate>Tue, 21 Apr 2026 15:48:02 +0900</lastBuildDate><atom:link href="https://blog.gao-ai.com/tags/human-annotation/index.xml" rel="self" type="application/rss+xml"/><item><title>LLMOps：評価基盤の運用編 — Langfuse 活用</title><link>https://blog.gao-ai.com/posts/2026-04-21-llm-eval-ops-guide/</link><pubDate>Tue, 21 Apr 2026 15:48:02 +0900</pubDate><guid>https://blog.gao-ai.com/posts/2026-04-21-llm-eval-ops-guide/</guid><description>&lt;p&gt;こんにちは。ガオ株式会社の黒澤です。本記事は「&lt;a href="../2026-04-21-llm-eval-design/"&gt;LLMOps：評価基盤の設計編 — Langfuse 活用&lt;/a&gt;
」の続編です。&lt;/p&gt;
&lt;p&gt;設計編では評価軸の定義から Judge プロンプト設計・ゴールデンデータセット構築・メタ評価（Cohen&amp;rsquo;s Kappa・Confusion Matrix）まで解説しました。本記事ではその後の「誰が・いつ・どうやって評価を運用するか」を整理します。&lt;/p&gt;</description></item><item><title>LLMOps：評価基盤の設計編 — Langfuse 活用</title><link>https://blog.gao-ai.com/posts/2026-04-21-llm-eval-design/</link><pubDate>Tue, 21 Apr 2026 15:48:02 +0900</pubDate><guid>https://blog.gao-ai.com/posts/2026-04-21-llm-eval-design/</guid><description>&lt;p&gt;こんにちは。ガオ株式会社の黒澤です。以前「&lt;a href="https://www.gao-ai.com/post/llmops%E3%81%A8%E3%81%AF-mlops%E3%81%A8%E3%81%AE%E9%81%95%E3%81%84%E3%82%84%E7%94%9F%E6%88%90ai%E3%81%AE%E8%A9%95%E4%BE%A1%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%E8%A7%A3%E8%AA%AC" target="_blank" rel="noopener noreferrer"&gt;LLMOpsとは? MLOpsとの違いや生成AIの評価について解説&lt;/a&gt;
」で LLMOps の全体像を整理しました。&lt;/p&gt;</description></item></channel></rss>