AIFCC
記事一覧へ
claude-setupclaude-workflowharness-design

Opus 4.7を最大限活かす6つのTips — Anthropicエンジニアの実践

Boris Cherny@bcherny
1,03966
Opus 4.7 をここ数週間ドッグフーディングして、生産性が劇的に上がっていると感じています。4.7 をより活かすためのヒントをいくつかシェアします🧵 1/ Auto mode = 許可プロンプトからの解放。Opus 4.7 は、深いリサーチ・コードリファクタリング・複雑な機能の実装・パフォーマンスベンチマーク達成まで繰り返し試行するといった、複雑で長時間にわたるタスクが得意です。以前は、このような長時間タスクを実行する際にモデルに張り付いて監視するか、--dangerously-skip-permissions を使うかしかありませんでした。最近、より安全な代替手段として auto mode をリリースしました。このモードでは、許可プロンプトがモデルベースの分類器にルーティングされ、コマンドが安全かどうかを判断します。安全であれば自動承認されます。つまり、モデルが実行中に張り付いて監視する必要がなくなります。さらに、複数の Claude を並列で動かせるようになります。ひとつの Claude が作業中であれば、次の Claude に切り替えられます。Auto mode は現在、Max・Teams・Enterprise ユーザー向けに Opus 4.7 で利用可能です。CLI では Shift-Tab で auto mode に入れます。Desktop または VSCode ではドロップダウンから選択できます。 2/ 新しい /fewer-permission-prompts スキル。また、新しい /fewer-permission-prompts スキルもリリースしました。これはセッション履歴をスキャンし、安全であるにもかかわらず繰り返し許可プロンプトを引き起こしていた bash コマンドや MCP コマンドを検出します。そして、パーミッションの許可リストに追加すべきコマンドの一覧を提案します。特に auto mode を使わない場合は、これを活用してパーミッション設定を最適化し、不要な許可プロンプトを減らしましょう。 3/ Recaps(要約機能)。今週の初め、Opus 4.7 に向けた準備として recaps をリリースしました。Recaps は、エージェントが何をやったか・次に何をするかを短くまとめた要約です。数分から数時間後に長時間セッションに戻ってきたときに非常に役立ちます。 4/ Focus mode。CLI の新しい focus mode がとても気に入っています。中間の作業過程をすべて隠し、最終結果だけに集中できます。モデルは適切なコマンドを実行し、適切な編集を行うと概ね信頼できるレベルに達しているので、私は最終結果だけを確認するようにしています。/focus でオン/オフを切り替えられます。 5/ effort レベルの設定。Opus 4.7 はシンキングバジェットの代わりに adaptive thinking(適応的思考)を採用しています。モデルの思考量を増減させたい場合は、effort を調整することを推奨します。レスポンスを速くしてトークン消費を抑えたい場合は lower effort を使いましょう。最高の知性と能力を引き出したい場合は higher effort を使いましょう。個人的には、ほとんどのタスクには xhigh effort を、最も難しいタスクには max effort を使っています。max は現在のセッションにのみ適用されます。他の effort レベルは固定設定として保存され、次のセッションにも引き継がれます。/effort で effort レベルを設定できます。 6/ Claude に自分の作業を検証する手段を与える。最後に、Claude が自分の作業を検証できる手段を必ず用意してください。これは常に Claude から得られる成果を2〜3倍にする方法でしたが、4.7 ではこれまで以上に重要になっています。検証の方法はタスクによって異なります。バックエンド作業であれば、Claude がサーバー/サービスを起動してエンドツーエンドでテストできるようにしておきましょう。フロントエンド作業であれば、Claude Chromium 拡張機能を使って Claude がブラウザを操作できるようにしましょう。デスクトップアプリには computer use を使いましょう。個人的には、最近のプロンプトの多くは「Claude、〇〇をやって /go」という形になっています。/go は、Claude が 1. bash・ブラウザ・computer use を使ってエンドツーエンドで自己テストを行い、2. /simplify スキルを実行し、3. PR を作成する、というスキルです。長時間の作業では、検証が重要です。タスクに戻ったときにコードが正常に動作していることを確認できるからです。 ハッピーコーディング!Opus 4.7 は大きな進化です。最大限に活用するためには、Claude がより長く動き続け、よりエージェント的に動作することを活かせるようワークフローを調整する時間を取ってください。従来のワークフローでも十分な改善を感じられますが、調整に時間をかければ大きな飛躍を実感できます。 --- コメント欄 --- @benstein:「あなたの継続的な X 投稿と透明性にどれだけ感謝しているか、ぜひ知ってほしいです。ありがとうございます、素晴らしいお仕事を続けてください!」 @rohitmidha23:「レート制限さえなければ全部試せたのに(笑)」 @amirkabbara:「レバレッジはたいてい一発出力ではなく、フィードバックループの中にあります。各アクションが次のアクションをより安く、より鋭く、またはより情報豊かにするとき、チームの成長は加速します。」 @DoDataThings:4.7 には最初から広いスコープを与えるようにシフトすべき。過度なプロンプトは出力品質を低下させる。 @RealChrisSean:「回答がかなり丁寧になったと感じています。個人的にはそれが好きです。」 @the_robvb:「Opus 4.7 に計画を立てさせて、Sonnet に実行させるのは今でも有効ですか?」 @TheRickyDotNet:「auto mode でも同じことに対して何度も許可を求めてくる」 @AndyGarrisonKS:コーディング以外のユーザーは、adaptive thinking が 4.6 の extended thinking と比べてパフォーマンスが劣ると感じている。 @cuongdoan1710:plan mode でもデフォルトで auto mode を使い、アクション前に徹底的なレビューを行うよう求めるリクエスト。 @Muquero:compact セッション切り替え時に focused なプロンプトを伴う「handoff(引き継ぎ)」機能の提案。 @maxreturns_:「トークンをガバガバ使っている。2時間で 0% から 15% に達した」
原文を表示 / Show original
Dogfooding Opus 4.7 the last few weeks, I've been feeling incredibly productive. Sharing a few tips to get more out of 4.7 🧵 1/ Auto mode = no more permission prompts. Opus 4.7 loves doing complex, long-running tasks like deep research, refactoring code, building complex features, iterating until it hits a performance benchmark. In the past, you either had to babysit the model while it did these sorts of long tasks, or use --dangerously-skip-permissions. We recently rolled out auto mode as a safer alternative. In this mode, permission prompts are routed to a model-based classifier to decide whether the command is safe to run. If it's safe, it's auto-approved. This means no more babysitting while the model runs. More than that, it means you can run more Claudes in parallel. Once a Claude is cooking, you can switch focus to the next Claude. Auto mode is now available for Opus 4.7 for Max, Teams, and Enterprise users. Shift-tab to enter auto mode in the CLI, or choose it in the dropdown in Desktop or VSCode. 2/ The new /fewer-permission-prompts skill. We've also released a new /fewer-permission-prompts skill. It scans through your session history to find common bash and MCP commands that are safe but caused repeated permission prompts. It then recommends a list of commands to add to your permissions allowlist. Use this to tune up your permissions and avoid unnecessary permission prompts, especially if you don't use auto mode. 3/ Recaps. We shipped recaps earlier this week, to prep for Opus 4.7. Recaps are short summaries for what an agent did & what's next. Very useful when returning to a long-running session after a few minutes or a few hours. 4/ Focus mode. I've been loving the new focus mode in the CLI, which hides all the intermediate work to just focus on the final result. The model has reached a point where I generally trust it to run the right commands and make the right edits. I just look at the final result. /focus to toggle on/off. 5/ Configure your effort level. Opus 4.7 uses adaptive thinking instead of thinking budgets. To tune the model to think more/less, we recommend tuning effort. Use lower effort for faster responses and lower token usage. Use higher effort for the most intelligence and capability. Personally, I use xhigh effort for most tasks, and max effort for the hardest tasks. Max applies to just your current session; other effort levels are sticky and persist for your next session also. /effort to set your effort level. 6/ Give Claude a way to verify its work. Finally, make sure Claude has a way to verify its work. This has always been a way to 2-3x what you get out of Claude, and with 4.7 it's more important than ever. Verification looks different depending on the task. For backend work, make sure Claude knows how to start up your server/service to test it end to end; for frontend work, use the Claude Chromium extension to give Claude a way to control your browser; for desktop apps, use computer use. Personally, many of my prompts these days look like "Claude do blah blah /go". /go is a skill that has Claude 1. Test itself end to end using bash, browser, or computer use 2. Run the /simplify skill 3. Put up a PR. For long running work, verification is important because that way when you come back to a task, you know the code works. Happy coding! Opus 4.7 is a significant step up. To get the most out of it, take the time to adjust your workflow to take advantage of Claude running for longer & being more agentic. It feels like a nice improvement with old workflows, and a significant leap once you take the time to adjust. --- Comments --- @benstein: "Just want you to know how much we all appreciate your ongoing X posts and transparency. Thank you and keep up the amazing work!" @rohitmidha23: "could've tried all this if the rate limit allowed lol" @amirkabbara: "The leverage is usually in the feedback loop, not the one-shot output. Teams improve faster when each action makes the next one cheaper, sharper, or more informed." @DoDataThings: Shift toward giving 4.7 wider initial scope; over-prompting degrades output. @RealChrisSean: "I noticed it being much more thorough in its responses which I personally like." @the_robvb: "Is it still a good idea to let Opus 4.7 make the plan, and let Sonnet execute?" @TheRickyDotNet: "It also still asks for permission 1000 times for the same thing in auto mode" @AndyGarrisonKS: Non-coding users finding adaptive thinking underperforms 4.6's extended thinking. @cuongdoan1710: Requests plan mode use auto-mode by default for thorough review before actions. @Muquero: Proposes "handoff" feature for compact session transitions with focused prompts. @maxreturns_: "It eats tokens, I'm at 15%, up from 0%, in 2 hours"

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

Opus 4.7を最大限活かす6つのTips — Anthropicエンジニアの実践 | AIFCC