AIFCC
記事一覧へ
agent-opsAIOpenClaw

AIエージェント音声常時ONな生活を快適にするためにやったこと

usedhonda@usedhonda
13315🔖 200👁 51,996
耳をふさががないイヤホン、FreeClip2が良くて、仕事している時はもちろん、それこそ接客中でも、、最近はつけっぱなしが多かったりします。 https://www.youtube.com/watch?v=PoS4nQEqfLM こいつをつかって試したかった、 「OpenClawからの音声メッセージを、天の声っぽく自分だけに届ける」 に取り組んでみた連休でした。 必要なものリスト ライフログ飛ばすアプリ(自作) ヘルスデータ取るためのハードウェア 閲覧履歴飛ばすChrome拡張(自作) AIエージェント音声の再生アプリ(自作) OpenClawゴリゴリチューニング・・ あたりですかね。 1.ライフログ飛ばすアプリ(自作) 周囲の音声データ(できれば自分とそれ以外に分離) 位置情報 Appleヘルスのデータ その他・・ ライフログ等と言いながら、Apple Watch持ってないわたくしなので・・、この辺を飛ばしてくれるアプリ、自作しました。自分専用、アップル審査気にしなくていいので、好き放題にデータとってます。これらを回線状況を一応みながらも、基本バンバンOpenClawに投げまくります。 2.ヘルスデータ取るためのハードウェア 万歩計だけでは物足りないので、私はこれ。 https://issin.cc/pages/smart-recovery-ring 他だったら、血糖値スパイク取るとかもアリかなと。(血糖値急激に上がったら、AIエージェントがすぐに耳元でビシッと運動を促すのは、糖尿病予防のビジネスとしては、可能性ありそうな・・) 3.閲覧履歴飛ばすChrome拡張(自作) OpenClawにMacブラウザの閲覧履歴を飛ばすだけのChrome拡張を自作。こういうのを作るのは、ホント楽になりました。 4.AIエージェント音声の再生アプリ(自作) こんな感じで、見てるサイトや周囲の会話へのツッコミ、テキストと音声を受け取る再生アプリが必要になる。 5.OpenClawゴリゴリチューニング 自作iPhoneアプリから飛んできた音声ファイルのSTT、精度、時間、コストのバランス 意味のあるタイミングで、気の利いたコメントをどう生成するか? 生成コメントをiPhoneに戻して再生するにあたり、どこでTTSさせるか? とかとか・・わかりやすく沼りまする。 同じことを書いてもモデルによって言うこと聞かないなどはザラにあったりでしたが、想定内の範囲かと。 作ってみてから気付いた、意外な課題・・ パソコンに向かいながら、一人で静かに使ってる分には良かったんですよ。眺めているウェブページにツッコミ入れてくれたりとか。問題は他人との会話中。周囲との会話内容にちょっと遅れて、AIエージェントが思ったことを言ってくれるのは、なかなか新しい体験で面白いんですが、いくら耳の空いたFreeClipを使っているとは言え、割り込んで入るAI音声がさすがに邪魔だなと。。 空間オーディオでAIと新たな距離感 で、思いついたのが、PANをセンターに置くんじゃなく、空間オーディオを使って、AIエージェントの声を空間内のどこから発するかアプリで設定できるようにすれば、両耳のど真ん中を取られずに、煩わしさも軽減されるかなとやってみたのが、こちら。(上記4のアプリ設定) イヤホンで聞くとわかるんですが、ジョジョのスタンドが、自分の近くでなんか言ってる・・みたいな、AIとのインターフェースとしては、なかなか新感覚で、しばらくこの使い方を続けて何か気づけたらまたシェアしようかと思ってます!
原文を表示 / Show original
耳をふさががないイヤホン、FreeClip2が良くて、仕事している時はもちろん、それこそ接客中でも、、最近はつけっぱなしが多かったりします。 https://www.youtube.com/watch?v=PoS4nQEqfLM こいつをつかって試したかった、 「OpenClawからの音声メッセージを、天の声っぽく自分だけに届ける」 に取り組んでみた連休でした。 必要なものリスト ライフログ飛ばすアプリ(自作) ヘルスデータ取るためのハードウェア 閲覧履歴飛ばすChrome拡張(自作) AIエージェント音声の再生アプリ(自作) OpenClawゴリゴリチューニング・・ あたりですかね。 1.ライフログ飛ばすアプリ(自作) 周囲の音声データ(できれば自分とそれ以外に分離) 位置情報 Appleヘルスのデータ その他・・ ライフログ等と言いながら、Apple Watch持ってないわたくしなので・・、この辺を飛ばしてくれるアプリ、自作しました。自分専用、アップル審査気にしなくていいので、好き放題にデータとってます。これらを回線状況を一応みながらも、基本バンバンOpenClawに投げまくります。 2.ヘルスデータ取るためのハードウェア 万歩計だけでは物足りないので、私はこれ。 https://issin.cc/pages/smart-recovery-ring 他だったら、血糖値スパイク取るとかもアリかなと。(血糖値急激に上がったら、AIエージェントがすぐに耳元でビシッと運動を促すのは、糖尿病予防のビジネスとしては、可能性ありそうな・・) 3.閲覧履歴飛ばすChrome拡張(自作) OpenClawにMacブラウザの閲覧履歴を飛ばすだけのChrome拡張を自作。こういうのを作るのは、ホント楽になりました。 4.AIエージェント音声の再生アプリ(自作) こんな感じで、見てるサイトや周囲の会話へのツッコミ、テキストと音声を受け取る再生アプリが必要になる。 5.OpenClawゴリゴリチューニング 自作iPhoneアプリから飛んできた音声ファイルのSTT、精度、時間、コストのバランス 意味のあるタイミングで、気の利いたコメントをどう生成するか? 生成コメントをiPhoneに戻して再生するにあたり、どこでTTSさせるか? とかとか・・わかりやすく沼りまする。 同じことを書いてもモデルによって言うこと聞かないなどはザラにあったりでしたが、想定内の範囲かと。 作ってみてから気付いた、意外な課題・・ パソコンに向かいながら、一人で静かに使ってる分には良かったんですよ。眺めているウェブページにツッコミ入れてくれたりとか。問題は他人との会話中。周囲との会話内容にちょっと遅れて、AIエージェントが思ったことを言ってくれるのは、なかなか新しい体験で面白いんですが、いくら耳の空いたFreeClipを使っているとは言え、割り込んで入るAI音声がさすがに邪魔だなと。。 空間オーディオでAIと新たな距離感 で、思いついたのが、PANをセンターに置くんじゃなく、空間オーディオを使って、AIエージェントの声を空間内のどこから発するかアプリで設定できるようにすれば、両耳のど真ん中を取られずに、煩わしさも軽減されるかなとやってみたのが、こちら。(上記4のアプリ設定) イヤホンで聞くとわかるんですが、ジョジョのスタンドが、自分の近くでなんか言ってる・・みたいな、AIとのインターフェースとしては、なかなか新感覚で、しばらくこの使い方を続けて何か気づけたらまたシェアしようかと思ってます!

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

AIエージェント音声常時ONな生活を快適にするためにやったこと | AIFCC