AIFCC
記事一覧へ
claude-workflowai-thinkingclaude-setup

Claudeのトークン制限を二度と超えない方法:5ステップガイド

890103
Claudeのトークン使用制限を二度と超えない方法 10分後には、Claudeのトークン使用制限に永遠に悩まされなくなります。 正直に言いましょう。Claudeの使用制限はストレスです。あの感覚はご存知でしょう——Claudeとの深いプロンプトセッションの最中に、突然数時間のアカウント制限に達してしまうのです。 これらの戦略を実装する前、月200ドルのAnthropicプランでも定期的にこれが発生し、レート制限は生産性の大きなボトルネックでした。 レート制限が業務を大幅に妨げていたため、Claudeの仕組みと、なぜ常にこれらの制限に達するのかを深く理解することにしました。 発見したのは、実はClaudeの使い方を完全に間違えていたということです。 その後、Claudeを適切に使うことでこの問題を解決し、過去3週間は一度もトークンのレート制限に達していません。 この記事では、その方法を詳しく説明します。皆さんが私のフレームワークを再現することで価値を見出していただければ幸いです。 記事の最後には、ここで紹介するすべてのヒントをまとめた無料PDFを添付しています。Claudeに直接入力するだけで、トークン使用量を削減するためにアカウントを完全に最適化できます。 ## ステップ1:計画 Claudeプロンプトを送信する前に、何が欲しいかを正確に把握しておく必要があります。 Claudeアカウントを監査すれば、ブレインストーミングに費やした大量の無駄なプロンプトが見つかるはずです。 Claudeはブレインストーミングツールとしてはすばらしいですが、Opusを使うのは間違いです。 代わりに、ブレインストーミング専用に安価なモデル(Haikuなど)を使い、何が欲しいかわかったときだけ高価なモデルに切り替えることを強くお勧めします。 ### ワークフローの改善 モデル選択については後で詳しく説明します。 Claudeの仕組みを理解することも重要です。 トークンを消費するのは、シンプルなテキストチャットではありません。 描画・コーディング・構築がアカウントを消耗させるのです。 だからこそ最大のアドバイスは、計画に時間をかけ(できれば安価なモデルで)、構築する時間になったときだけOpusに切り替えることです。 例:2人がファイナンス追跡アプリをバイブコードで作ろうとしている場合 人物A:2分間計画してアプリを3回作り直す。 人物B:20分間計画してアプリを1回だけ構築する。 驚くことに、人物Bはこのタスクだけで約67%(約1.50ドル)節約できます。 さらに一歩進めるには、Claude Code内の専用「プランモード」を使用できます。 プランモードはClaudeに計画に明示的に集中するよう指示します。 Shift + Tab 2回または /Plan **まとめ**:計画に時間をかけ、このブレインストーミング/計画フェーズに安価なモデルを使用する。 ## ステップ2:チャットの長さ 長いチャットはサイレントキラーです。 同じタスクで同じチャットを継続して使い続けているなら、これを理解してほしい: 長いチャットを使うことは、Claudeに古いコンテキストを読み続けるよう指示しているのと同じです。 これはトークンをより多く使い、時間もかかるだけでなく、無関係な情報で出力品質を希釈させます。 いくつか良い解決策があります: ### プロジェクト 繰り返しのタスクに1つのチャットを使い続けるのではなく、複数のチャットを管理するプロジェクトを設定してください。 例えば、私は複数のサブチャットを持つ専用の「Xライティング」プロジェクトを持っています: 新しいものを書きたいとき、このプロジェクトの新しいチャットを開きます。するとすべての指示を理解した状態でスタートできます。 **プロチップ**:これらのプロジェクト内で、トークン使用量を節約しようとしていることをClaudeに伝えるだけでいいのです。 指示にこのようなものを入れるだけ: 「トークン使用量を節約しようとしていることを意識してください。簡潔に回答し、必要に応じて新しいチャットを開始すべき時や、トークン使用量を削減するのに役立つその他のヒントについてアドバイスしてください。」 ### メガプロンプト 次に、同じタスクで再利用するチャットがある場合、Claudeにこのようなことを伝えられます: 「新しいチャットに移行します。この会話のコンテキストを失うことなくセッションを再開できるプロンプトを作成してください。」 この2つの方法で、長い1つのチャットに頼る必要がなくなります。 **覚えておいて**:3つの単一チャットは1つの長いチャットより優れています。 ## ステップ3:適切なメモリ Claudeの最大の問題の1つはコンテキストを忘れることが多く、Claudeが実際に覚えていることをほとんどコントロールできないことです。 これにより、自分を再説明する必要が生じ、必要以上のトークンを使ってしまいます。 この問題を修正する方法(3つの戦略)について詳細なガイドを書きましたが、今すぐ最速の戦略をまとめましょう。 2つのマークダウンファイルを含む新しいデスクトップフォルダを作成したいと思います: **Instructions.MD** このファイルはClaudeのルールと指示をすべて伝えます: 例: ``` ## あなたは誰か ## 何をするか ## ルール ``` このファイルに含めることが重要:「時間とともに私の好みでMemory.MDを更新してください。」 この行は重要です。これがClaudeに2番目のマークダウンファイルにデータの継続的なメモリログを作成させる方法です。 **Memory.MD** これはClaudeの「脳」であり、時間とともに継続的に更新されます。 例: ``` ## 好み ## 修正事項 ## パターン ``` 「ダッシュを使うのをやめて」などと言えば、Claudeは指示ファイルを読み、このメモリファイルに入ってそれを更新することを知っています。 このフォルダにアクセスできるよう、Claude Code/Coworkにフォルダを添付してください。 このシステムを使い始めると、もう戻れません。 ## ステップ4:モデルスタッキングと選択 適切なモデル選択について先ほど簡単に触れました。今度は詳しく説明しましょう。 Opus 4.7をすべてに使うのは完全な無駄です。タスクの90%には他のモデルを使えて、最後の10%だけOpusに頼れます。 私は「エスカレート」システムを採用しています。最も安価なモデルから始め、必要な時だけOpusまで進みます。 Haiku(軽いタスク)→ Sonnet(中程度のタスク)→ Opus(重いタスクと最終キュレーション/実行) その他のモデル選択のヒント: **拡張/アダプティブ思考** ほとんどの時間はオフのままにしてください。 **スタイル** ほとんどの人はこれが存在することを知りませんが、Claudeのメインホームページには「スタイル」があります。スタイルを「簡潔」に切り替えて、使用しているモデルに短く簡潔な返答をするよう伝えられます。 **低労力** Claude Codeでは、ほとんどのタスクに「低」労力を選択できます。 最後に、すべてにClaudeを使う必要はありません。KimiやDeepSeekのようなオープンソースモデルに頼ることを恐れないでください。これらは非常に優れていて安価です。 ニュースや調査のスクレイピングのような単純なタスクにClaudeを使う必要はありません。 ## ステップ5:ツール分割と最適化 ほとんどの人は、さまざまなClaudeツールに異なる使用パラメータがあることを理解していません。 例えば、Claude Code/ChatはプランのOverall使用量と同じを使いますが、Claude Designは完全に別です。 これを理解し、いつClaudeツールを切り替えるかを知ることは、アカウント使用量を最適化するために重要です。 アカウントを最大限に活用するには、各ツールをその目的に合ったものに使用してください。 例えば、未使用のClaude Designトークンが余っているのに、ビジュアルのデザインにClaude Codeトークンを無駄にしたくないでしょう。 ## 最終ヒント - **追加クレジット**:新しいプランにアップグレードする代わりに(20ドル→100ドル、100ドル→200ドル)、代わりに少し追加クレジットを購入できます - **Claudeスキル**:繰り返しのタスクを自動化するためのClaudeスキルを構築する - **使用量の追跡**:制限に近づいていないか定期的に使用量を確認する - **/Usage**:Claude Codeで/Usageを実行して使用量を確認する(最近追加)——新しい「概要」セクションもあります ## まとめ AIの使用コストは今後も安くなることはないと思います。 だからこそ、長期的にお金を節約したいなら、今すぐアカウントの使用量を適切に最大化する方法を学ぶことが重要です。 ここでのヒントが役に立つことを願っています。 役に立ったと感じたら、@milesdeutscher をフォローしてください——私はAIに関する実際の学びと経験に基づいた記事をシェアしています。
原文を表示 / Show original
@milesdeutscher Never Hit Claude Usage Limits Ever Again 1.3K 1.3M In 10 minutes, you’ll never hit a Claude token usage limit again. Let's be honest with each other, Claude's usage limits suck. I'm sure you know the feeling: you're deep in a Claude prompting session, and out of nowhere, you've suddenly hit your account's usage limit for the next few hours. Before I implemented these strategies, this happened to me regularly (even on the $200/month Anthropic plan), and rate limits were a huge bottleneck on my productivity. Because rate limits were significantly hindering my work, I dove deep to understand first how Claude really works and, second, why I was constantly hitting these limits. What I discovered was that I was actually using Claude completely wrong. The good news is I've since fixed my usage limit issues by learning to use Claude properly, and for the past three weeks, I haven't hit a single token rate limit. In this article, I'll explain exactly how, and hopefully, you guys will find value in replicating my framework. At the very end, I included a free PDF with all the tips from this article. You can just plug it into Claude to fully optimise your account for less total token usage. Step One: Planning Before you send a single Claude prompt, you need to know exactly what you want. I can pretty much guarantee that if we audited your Claude account, you'd see a ton of wasted prompts on brainstorming. While Claude is an excellent brainstorming tool, using Opus for it is a mistake. Instead, I highly recommend using a cheaper model (like Haiku) for dedicated brainstorming and switching to an expensive model only once you know what you want. Fixing Your Workflow We'll dive deeper into model selection later. You also have to understand how Claude really works. Sending simple text chats isn't what burns tokens. Drawing, coding, and building are what drain your account. This is why one of the biggest tips I can give you is to spend more time planning (preferably with a cheaper model) and only switch to Opus when it's time to build. For example: Two people are trying to vibe-code a finance tracking app Person A: Spends 2 minutes planning and has to rebuild the app 3 times. Person B: Spends 20 minutes planning and only builds the app once. Believe it or not, Person B saves ~67% (about $1.50) on this task alone. Person A versus Person B To take this a step further, you can use the dedicated 'Plan Mode' inside Claude Code. Plan Mode tells Claude to explicitly focus on planning. Press Shift + Tab Twice or /Plan TLDR: Spend more time planning, and use cheaper models for this brainstorming/planning phase. Step Two: Chat Length Long chats are a silent killer. If you continuously use a single chat for the same task, I really want you to understand this: Using a long chat is essentially telling Claude to keep re-reading old context. Not only does this use more tokens and take longer, but it also dilutes your output quality with irrelevant information. There are a couple of good solutions: Projects Instead of using a single chat for repetitive tasks, set up a project to manage multiple chats. For example, I have a dedicated X-Writing project with multiple sub-chats: My X-Writing Project Anytime I want to write a new piece, I open up a brand new chat in this project, which understands all my instructions. Pro Tip: Within these projects, you can just tell Claude that you're trying to save on token usage. Just put something like this into your instructions: "Be cognisant of the fact I'm trying to save account usage. Be concise in your answers, and when appropriate, advise me on when I should start a new chat or any other tips that may help me reduce token usage." 2. Mega Prompts Secondly, if there's a chat you reuse for the same task, you can tell Claude something like: "I'm moving to a new chat; give me a prompt I can use to restart this session without losing any of our context from this conversation." With these two methods, you'll never have to rely on single, long chats again. Remember: 3 single chats are better than one extremely lengthy chat Step Three: Proper Memory One of the biggest issues with Claude is that it often forgets context, and you have little control over what Claude actually remembers about you. This results in you having to re-explain yourself, which means you use more tokens than necessary. I wrote an entire in-depth guide on how to fix this problem (3 strategies), but let me summarize the quickest strategy now. AI Edge @aiedge_ Apr 22 Article How to Give Claude Perfect Memory (complete guide) I don't care what anyone tells you - by default, Claude's memory is basically useless. It frequently forgets context; you constantly have to re-explain yourself, and even after you do, it still often... 1.9K 1.9M You want to create a new desktop folder with two markdown files: Instructions. MD This file tells Claude all your rules & instructions: Example: ## Who you are ## What you do ## Rules Important to include in this file: "Update Memory .MD with my preferences over time." This line is crucial; it's how you get Claude to create a running memory log of your data in the second markdown file. 2. Memory.MD This is the "brain" of Claude, and it gets continuously updated over time. Example: ## Preferences ## Corrections ## Patterns Now, whenever you say something like "stop using em dashes," Claude will read your instructions file and know to go into this memory file and update it. Just make sure to attach your folder to Claude Code/Cowork so it can access these files. If you're having trouble building these files, just ask Claude for help. Once you use this system, you'll never go back. Step Four: Model Stacking & Selection I briefly touched on proper model selection earlier; now let's dive deeper. Using Opus 4.7 for everything is a complete waste. You can use other models for 90% of tasks and rely on Opus for the last 10%. I like to run an "escalate" system where I start with the cheapest model, and only work my way up to Opus when needed. Start with Haiku (light tasks) → Sonnet (medium tasks) → Opus (heavy tasks and final curation/execution). "Escalate" A few more model selection tips Extended/Adaptive Thinking Leave this off most of the time. Swipe Off 2. Styles Most people don't know this exists, but on the main Claude homepage, there are 'Styles.' You can switch your style to "Concise" to tell the model you're using to give short, concise replies. Switch to Concise 3. Low Effort In Claude Code, you can select "Low" effort for most tasks. Claude Code: "Low" Effort Lastly, you don't need to use Claude for everything. Don't be afraid to rely on open-source models like Kimi or DeepSeek, which are extremely good and cheap. There's no need to use Claude for simple tasks like news and research scraping. Step Five: Tool Splitting & Optimisations Most people don't realize that various Claude tools have different usage parameters. For example, Claude Code/Chat uses the same usage under your overall plan, while Claude Design is completely separate. Understanding this and knowing when to swap between Claude tools is critical for optimising your account usage. To get the most out of your account, stick to each respective tool for what it was built for. For example, you don't want to waste Claude Code tokens designing visuals when you have unused Claude Design tokens lying around. Some Final Tips Extra credits: Instead of upgrading to a new plan ($20 → $100 or $100 → $200), you can purchase a few extra credits instead. Claude Skills: Build Claude skills to automate repetitive tasks. Track Usage: Check in on your usage regularly so you're not blindsided - simply knowing you're approaching your limit may help you change your prompting habits/leverage the tips discussed here. /Usage: In Claude Code, run /Usage to check your usage (added recently) - there is also a new 'Overview' section now. Closing I don't expect AI usage to get any cheaper. That's why learning how to properly maximise your account usage now is critical if you want to save money long term. I hope you found my tips here helpful in doing so. If you did, be sure to follow me @milesdeutscher - I share articles just like this based on my real learnings and experiences with AI. As promised, the full PDF that has all the tips discussed here is attached below. All you have to do is sign up for the AI Edge newsletter (free) and join my Instagram community to access the Google Drive where it's posted (free). https://www.aiedgehq.co/ https://www.aiedgehq.co/ 100% free, no spam ever, and unsubscribe anytime 1.3M Views 1.3K 5.3K ies Miles Deutscher @milesdeutscher Obsessed with AI. Tweets aren’t financial advice. Building @aiedge_ . What’s happening 急病のため死去 メルブラ新作 シュドゥン #グラブルEXフェス2026

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

Claudeのトークン制限を二度と超えない方法:5ステップガイド | AIFCC