記事一覧へ
人間が積極的に取り組んでいる問題に対して、どのようにしてLLMハーネスを自律的に改善できるか?すべての過去のコード、トレース、スコアにわたる困難で長期間の信用割り当て問題を解決する必要があります。
LLMharness-designAIagent-ops
LLMハーネスが自律的に改善できるか?長期クレジット割り当て問題の解決
♥ 1,442↻ 297🔖 1,709👁 373,254
原文を表示 / Show original
How can you autonomously improve an LLM harness on problems that humans are actively working on?
To do this, you need to solve the difficult, long-horizon credit assignment problem across all past code, traces, and scores.