はじめに
スキルを数えるスキル1、nikkieです。
以前に少し触ったMyGPTsの素振りの続きです。
いろんなGPTが世に解き放たれていますが、Actionという概念を理解したいなと思いました。
目次
Actionの例:WebPilot
Actionのドキュメントはこちら:
https://platform.openai.com/docs/actions
今回は既存のAction、WebPilotを設定してみました。
Add WebPilot to your GPTs in 30s:
— CocoSgt (@CocoSgt_twt) 2023年11月9日
- Step 1: In the Config tab, uncheck the "Web Browsing" option
- Step 2: Click [Add Action]
- Step 3: Set up
Import OpenAPI schema: https://t.co/tWRZ0Mftzy
Privacy Policy: https://t.co/Tm3x9aHBmP#GPTs pic.twitter.com/k22JHbNgRs
- OpenAIが提供するWeb Browsingのチェックを外す
- 代わりにWebPilotを使う設定をしていく
- ConfigureタブのActionsで「Create new Action」
(上の画像は、設定を終え、「gpts.webpilot.ai」Actionができている状態です)
設定値
- Schemaは「Import from URL」で https://gpts.webpilot.ai/gpts-openapi.yaml を指定してImport2
- これにより Available actions が設定された(YAMLで定義されているっぽい)
- Authenticationは「None」のまま
- Privacy policyに https://gpts.webpilot.ai/privacy_policy.html を指定
- 今回はActionを設定する素振り目的なので精査していませんが、WebPilotのPrivacy policyをよく確認の上でご利用ください
これだけで済みました、簡単!
「gpts.webpilot.ai」Action、できあがり!
このGPTとの会話の様子です。
URLで指定した論文を要約してもらっています
(許可を求められています3。先ほどのPrivacy policyですね)
要約を見ると、PDFの内容が取得できていると思われます!
これはOpenAIのWeb Browsingでは取得できなかったんですよ
雑感
WebPilot Actionがすごい
PDFが取得できるのはすごいですね。
WebPilot Actionでは、GPTがWebPilotとやり取りしてURLのコンテンツが取得できています。
Actionの中の動きはブラックボックスです。
デフォルトのOpenAI製Web Browsingでは、進行状況の表示によると、まずBingで検索する動きをしています。
PDFを指定したときは、Bingで検索した後にアクセスできないと返されました
WebPilotを知ったきっかけは性能がいいというこちらの投稿です
いろいろ記事や論文、PDF などの抽出系の便利 GPTs を作ったけれど、すべて WebPilot で十分だった...かなわない...https://t.co/3ffO4Qpujy https://t.co/sm7I8ZElup
— ぬこぬこ (@schroneko) 2023年11月14日
WebPilot Actionを使わないワークアラウンド
今回比較のために以下のGPTsを試しています。
- Paper Interpreter (Japanese)
- 論文読める君
- https://chat.openai.com/g/g-qmXM09KRi-lun-wen-yomerujun
結構良いGPTsできたので、みんな使ってみて。落合陽一フォーマットで論文を読んでくれる、名付けて「論文よめる君」です!https://t.co/6GQwAaT3Dr pic.twitter.com/uoCE3c48XP
— 🌍The Earth🌏 (@yuiseki_) 2023年11月15日
これらにはarXiv Vanityのリンクを渡すとうまくいきました。
https://www.arxiv-vanity.com/papers/1412.6980/
arXiv Vanity4はPDFの代わりにレスポンシブのサイトとしてarXivの論文を表示します。
これはOpenAI製Web Browsingでアクセスできるんですね(Bingで検索 -> アクセス -> 内容取得している)。
「論文読める君」が、Bingで検索 -> arXiv Vanityにアクセスという動きをしていて、arXiv Vanityを知りました。
GPT Builderがすごい
以前触ったときにも体験した5のですが、自然言語でconfigureできるのは改めてすごいなと思いました。
Builderとやり取りを重ねる中で、プラクティスに沿ったと思われるconfigureになるんですよね。
Instructions、独力では絶対に以下のフォーマットを導けないです
Role and Goal: Constraints: Guidelines: Clarification: Personalization:
このチャットUIにより、ノーコードでカスタマイズしたGPTができちゃうわけですよ!
そしてActionを使えば、カスタマイズしたGPTは外部のAPIを利用できるわけです。
できることがめちゃくちゃ広がります!
感想
既存のActionを指定して、Actionの概念を掴みました。
Actionを介してGPTが外部のシステムと対話し協働する、これってアイうた(アイの歌声を聴かせて)の世界観じゃん!
テンション上がってきた
P.S. この先はAction自作へ
以下を参考に引き続き手を動かす予定です。
GPTs用に自動的にAPIの設計書を書いてくれるGPTsを作りました。
— だるまと赤べこ (@DarmaAkabeko) 2023年11月18日
「○○な機能のAPIが欲しい」とか「○○(APIの名前)を使いたい」とか入力するだけで、それに応じたjsonファイルが出力されます。それをGPTsのActionsに入れるだけで使用できます。…
-
↩GPT Finderみたいなアイデアかなり好き。
— nikkie / にっきー (@ftnext) 2023年11月23日
そしてGPTsはめだかボックスの安心院さん感がある(スキル量おばけ)。
スキルを数えるスキルみたいに、GPT FinderはGPTsからGPTを探すGPT https://t.co/8kwyFslTp1 - これはOpenAPIの仕様で、https://platform.openai.com/docs/actions/hosted-openapi-specification によるとOpenAIがホストもしてくれるみたいです(With Actions, OpenAI now hosts the OpenAPI specification for your API. )↩
- YAMLではx-openai-isConsequentialをfalseにしています。このパラメタの設定については https://platform.openai.com/docs/actions/consequential-flag に記載があります↩
- https://github.com/arxiv-vanity/arxiv-vanity↩
- からあげさんの記事を参照しています ↩