記事一覧へ
要約:より良いハーネスを構築することで、より良いエージェントを構築できる。しかし「より良い」ハーネスを自律的に構築するには、「ヒルクライム」するための強力な学習シグナルが必要だ。我々はEvalsをそのシグナルとしてどう活用しているかを共有する。

harness-designagent-ops
ハーネス改善のための評価駆動レシピ
♥ 876↻ 95
原文を表示 / Show original
TL;DR: We can build better agents by building better harnesses. But to autonomously build a “better” harness, we need a strong learning signal to “hill-climb” on. We share how we use evals as that