はじめに
七尾百合子さん、お誕生日 139日目 おめでとうございます! nikkieです。
気になるWebinarをレコーディング聴講しました。
自律的なエージェントを作る/使うために参考になる内容でした。
目次
- はじめに
- 目次
- Mastering Async Agents: Production Insights from Cognition Labs
- Anthropic「Building Async Agent with Claude 4」
- Devin「Using & Building Async Agents」
- 終わりに
Mastering Async Agents: Production Insights from Cognition Labs
CognitionのTwitterアカウントから知りました。
Join @walden_yan and the @AnthropicAI team for a deep dive and Q&A on building async agents.
— Cognition (@cognition_labs) 2025年7月29日
Sign up for Thursday’s webinar below. pic.twitter.com/JYwK2tqOx4
豪華登壇者!
- AnthropicのApplied AI LeadのJeremyさん
- 「Building Async Agent with Claude 4」
- CognitionのCo-founderのWaldenさん1
- 「Using & Building Async Agents」
開催後にフォーム入力してもレコーディングの視聴ができるようです2。
ON24というサービスを使って配信していて、字幕などに頼れない素の英語環境なので覚悟は必要です。
Anthropic「Building Async Agent with Claude 4」
Claudeを使ってエージェントを構築する方法について。
数回聞いたのですが、非同期という話はあんまりしていないように思われます
Anthropicのエージェントの定義は「LLMs autonomously using tools in a loop」
Claudeでエージェント構築
Claudeはエージェントを構築できるように機能提供。
後者の記事で紹介された
他にも聞きながら見つけた
エージェント向けコンテキストエンジニアリング
ここはおすすめです。
以下の3つについてでした:
- Instructions
- Tools
- Memory
Instructionsの例はこちら:
https://gist.github.com/ftnext/97d5c59690a521b9530985b2912cc57f
案内された以下でも見かける「Think like your agents!」に尽きますね
Think like your agents. (Prompt engineering and evaluations for research agentsより)
Toolsは「どう定義すればいいんだろう」と思ってましたが、「tool nameとdescriptionをあまりにも類似させるのを避ける」というのは1つ指針になりそうです。
Memoryはあんまり考えたことがなかったのですが、将来有用かもしれない情報を外部ファイルシステムに保存させるとのこと。
出された例は「Introducing Claude 4」にあるポケモンプレー。
Claudeへの入力はスクリーンショットですが、これだとコンテキストウィンドウを食うのでメモをとらせるそうです。
続くDevinの例でもメモをとらせていて、複雑なタスクはコンテキストに鍵となる情報だけを入れ続けるんだなあと気づきました。
Devin「Using & Building Async Agents」
ソフトウェアエンジニアであるAIエージェントDevinを非同期に使う方法の紹介が主でした。
DevinやDeepWikiの開発画面(Devin)を見せながら進みます。
使う
Cognition的には非同期で動くAIエンジニアDevinに実装をお任せして、エンジニアはエンジニアリングマネージャとして振る舞おうぜって考えてるみたいです3
- Quick idea -> Code
- 🧑💻💡💡 -> 🧑💻🤖🤖 -> 🧑💻✅✅
- https://devin.ai/agents101#quick-wins
- Devinに投げたら低コストでアイデアがコードに変わるので、コードを元に進めようという考え方みたいです
- First-draft PRs
- https://devin.ai/agents101#automate-your-first-drafts
- LLMを使えば文章をゼロから考えなくてもよいわけですが4、コーディングもDevinにまずドラフトしてもらって引き継ぐわけですね
- Automating Repetitive Work
- https://devin.ai/agents101#automating-workflows
- 例として「Convert JS to TS/TSX」playbook(=プロンプトテンプレート)
3のplaybookをスクショから書き起こしたのですが、書き方の学びがあります。
https://gist.github.com/ftnext/07fbacf66f9482314059ef70503ff1c8
- 手順を列挙
/tmp/notes.mdを更新させながら進めてます
- スタイルガイド
作る
非同期で動くエージェントの構築方法も紹介されました。
この記事は先日読んでました
Cognitionの「Don’t Build Multi-Agents」面白い。
— nikkie(にっきー) / にっP (@ftnext) 2025年6月12日
画像はブログから。
1枚目はframeworkが薦める構成だけどこのブログはwrongと主張。
このブログの主張は2枚目で、(エージェントは複数体いていいと理解したんですが)それまでのエージェントのトレースを(圧縮して)全部入れていく直列スタイル https://t.co/THq8mxRLHl pic.twitter.com/FnLp7n4IGN
終わりに
「Mastering Async Agents」から私が想像した内容とはだいぶ異なりました。
ですが、Anthropicのエージェントの定義は「ループの中で自律的にツールを使うLLM」なので、放っておけるわけですよね(Devinみたいに)。
非同期なエージェント、言い換えると自律的なエージェントを、どう作るか・使うかの回だったのかなと思われます。
このWebinarで新たに知ったものがあったというよりは、AnthropicやCognitionが公開している一次情報で理解している範囲を増やすのが重要という感触です。
一次情報を強制的に知る機会として、気になるWebinarを覗いていこうと思いました
- 先週日本に来てましたね ↩
- Webinars www.anthropic.com↩
- 私は、嫌↩
- 最近聞いた、あらたまいくお #2 の3:00あたり ↩