記事一覧へ
評価において、Opusアドバイザーを伴うSonnetは、単独のSonnetよりもSWE-bench Multilingualで2.7パーセントポイント高いスコアを達成し、一方でタスクあたり11.9%少ないコストで済みました。
ClaudeAI
OpusアドバイザーでSonnetの精度向上・コスト削減
♥ 729↻ 34🔖 59👁 77,339
原文を表示 / Show original
評価において、Opusアドバイザーを伴うSonnetは、単独のSonnetよりもSWE-bench Multilingualで2.7パーセントポイント高いスコアを達成し、一方でタスクあたり11.9%少ないコストで済みました。