nikkie-ftnextの日記

イベントレポートや読書メモを発信

AnthropicのWebinar「Mastering Async Agents: Production Insights from Cognition Labs」聴講メモ

はじめに

七尾百合子さん、お誕生日 139日目 おめでとうございます! nikkieです。

気になるWebinarをレコーディング聴講しました。
自律的なエージェントを作る/使うために参考になる内容でした。

目次

Mastering Async Agents: Production Insights from Cognition Labs

www.anthropic.com

CognitionのTwitterアカウントから知りました。

豪華登壇者!

  • AnthropicのApplied AI LeadのJeremyさん
    • 「Building Async Agent with Claude 4」
  • CognitionのCo-founderのWaldenさん1
    • 「Using & Building Async Agents」

開催後にフォーム入力してもレコーディングの視聴ができるようです2
ON24というサービスを使って配信していて、字幕などに頼れない素の英語環境なので覚悟は必要です。

Anthropic「Building Async Agent with Claude 4」

Claudeを使ってエージェントを構築する方法について。
数回聞いたのですが、非同期という話はあんまりしていないように思われます

Anthropicのエージェントの定義は「LLMs autonomously using tools in a loop

Claudeでエージェント構築

Claudeはエージェントを構築できるように機能提供。

後者の記事で紹介された

他にも聞きながら見つけた

エージェント向けコンテキストエンジニアリング

ここはおすすめです。
以下の3つについてでした:

  • Instructions
  • Tools
  • Memory

Instructionsの例はこちら:
https://gist.github.com/ftnext/97d5c59690a521b9530985b2912cc57f
案内された以下でも見かける「Think like your agents!」に尽きますね

Think like your agents. (Prompt engineering and evaluations for research agentsより)

Toolsは「どう定義すればいいんだろう」と思ってましたが、「tool nameとdescriptionをあまりにも類似させるのを避ける」というのは1つ指針になりそうです。

Memoryはあんまり考えたことがなかったのですが、将来有用かもしれない情報を外部ファイルシステムに保存させるとのこと。
出された例は「Introducing Claude 4」にあるポケモンプレー。
Claudeへの入力はスクリーンショットですが、これだとコンテキストウィンドウを食うのでメモをとらせるそうです。
続くDevinの例でもメモをとらせていて、複雑なタスクはコンテキストに鍵となる情報だけを入れ続けるんだなあと気づきました。

Devin「Using & Building Async Agents」

ソフトウェアエンジニアであるAIエージェントDevinを非同期に使う方法の紹介が主でした。
DevinやDeepWikiの開発画面(Devin)を見せながら進みます。

使う

Cognition的には非同期で動くAIエンジニアDevinに実装をお任せして、エンジニアはエンジニアリングマネージャとして振る舞おうぜって考えてるみたいです3

  1. Quick idea -> Code
    • 🧑‍💻💡💡 -> 🧑‍💻🤖🤖 -> 🧑‍💻✅✅
    • https://devin.ai/agents101#quick-wins
    • Devinに投げたら低コストでアイデアがコードに変わるので、コードを元に進めようという考え方みたいです
  2. First-draft PRs
  3. Automating Repetitive Work

3のplaybookをスクショから書き起こしたのですが、書き方の学びがあります。
https://gist.github.com/ftnext/07fbacf66f9482314059ef70503ff1c8

  • 手順を列挙
    • /tmp/notes.mdを更新させながら進めてます
  • スタイルガイド

作る

非同期で動くエージェントの構築方法も紹介されました。

この記事は先日読んでました

終わりに

「Mastering Async Agents」から私が想像した内容とはだいぶ異なりました。
ですが、Anthropicのエージェントの定義は「ループの中で自律的にツールを使うLLM」なので、放っておけるわけですよね(Devinみたいに)。
非同期なエージェント、言い換えると自律的なエージェントを、どう作るか・使うかの回だったのかなと思われます。

このWebinarで新たに知ったものがあったというよりは、AnthropicやCognitionが公開している一次情報で理解している範囲を増やすのが重要という感触です。
一次情報を強制的に知る機会として、気になるWebinarを覗いていこうと思いました


  1. 先週日本に来てましたね
  2. Webinars www.anthropic.com
  3. 私は、嫌
  4. 最近聞いた、あらたまいくお #2 の3:00あたり