Apple Silicon・CPUで、ストックマークの最近の話題にも詳しいLLMを動かす

はじめに

C102、土東6タ24bのアイうた合同誌をよろしくお願いします！ nikkieです。

世はまさに大LLM時代。
国内の各社からもLLMが公開されています！
ストックマークさんから公開されたLLMを手元のPCで動かしてみました。

ストックマーク最近の話題にも詳しいLLM

パラメタ数は14億（1.4B）です。
小さめなので当初手元で動かすつもりはなかったのですが、テックブログを見て興味を持ちました。

最近の話題に答えられている点にも興味を惹かれたのですが、これ、チャットっぽく聞けてない？（質問文を投げている）

「最近の画像生成AIをいくつか教えてください。」
「ラピダスはどのような企業？」

ChatGPTにはチャット形式で聞けますが、他のLLMを手元で動かしたときはチャット形式ではあんまり振るわなかった記憶があります。
1.4Bとパラメタ数が少ないのに、質問文投げられる（＝かしこい）のはすごいなと手を動かしてみたくなったのでした。

stockmark/gpt-neox-japanese-1.4bをModel cardのスニペットに沿って動かします。
ライブラリtransformersを使ったコーディングです

stockmark/gpt-neox-japanese-1.4bのサンプルコードを動かす

（CPUで動かすので、torch.float32を指定しています）

過去に別のLLMを動かしたときのスクリプト¹を拡張しています。

python generate.py stockmark/gpt-neox-japanese-1.4b -v

動作環境

過去に作った環境²にsafetensorsを追加して動かしました。

Python 3.10.9
transformers 4.29.2
torch 2.0.1
accelerate 0.19.0
safetensors 0.3.2

自然言語処理は

Model cardの例です。
24秒で以下を生成

自然言語処理は、人工知能(AI)や機械学習と密接な関係があります。例えば、「この文章を翻訳して」という依頼に対して「英語→日本語」「日本語→英語」といった具合に、機械が自動的に翻訳してくれるのは、まさにその例です。また、近年注目されているディープラーニングも、自然言語処理の技術の一つです。ディープラーニングとは、人間の言葉を機械で理解する技術のことです。この技術によって、音声認識の精度が飛躍的に向上しました。このように、自然言語処理にはさまざまな応用方法があります。そのため、自然言語処理の研究を行う際には、まずどのような分野に応用できるかを検討し、その上でどの分野に焦点を当てるかを決めることが大切です。

雰囲気はよさそうですが、ちょいちょい怪しいところもありますね

「ディープラーニングとは、人間の言葉を機械で理解する技術のことです。」
唐突な音声認識

AIによって私達の暮らしは、

OpenCALMのModel cardの例です。
25秒で生成

AIによって私達の暮らしは、ますます便利になっていくでしょう。
しかし、AIが人間を凌駕する日がくるのはまだ先の話です。
なぜなら、AIには「学習」という能力があるからです。
例えば、「AさんはBさんより賢い」と仮定して話を進めるとします。
この場合、AとBはどちらも同じくらい頭が良いということになりますよね?
でも、この2人が全く同じ知能を持っているわけではありません。
実は、AIにもそれぞれ得意な分野があります。
例えば、数学が得意な人と苦手な人がいるように、AIの得意分野は人によって異なります。
そのため、AIに仕事を任せる際には、その人に合った仕事を与える必要があります。
では、具体的にどのような仕事が

「AさんはBさんより賢い」けど「AとBは同じくらい頭が良い」？？？

最近の画像生成AIをいくつか教えてください。

テックブログの例です。
25秒で生成。

最近の画像生成AIをいくつか教えてください。
「Stable Diffusion」は、テキストから画像を生成するAIで、「Midjourney」「DALL・E2」「Stable Diffusion 2.0」などが有名です。「Google Colaboratory」で試すことができますが、GPUやメモリなどのリソースを消費するので、今回は割愛します。
「Midjourney」は、入力したテキストを学習して画像を生成してくれるサービスです。日本語にも対応していますし、無料で使えるので試してみてはいかがでしょうか?
「Stable Diffusion」は、テキストを入力するとそれをもとに画像を生成してくれます。こちらも無料なので試してみてください。

temperatureを指定していないですが、再現していますよね。
これはなんでだろう（temperatureのデフォルト値が0、とか？）

ラピダスはどのような企業？

テックブログの例その2。
8秒とめっちゃ速い！（なんでだろう、出力が短いから？）

ラピダスはどのような企業？
「日本の半導体産業の復活」をうたう、次世代半導体の国産化を目指す新会社。その名は「Rapidus」。2022年6月7日、トヨタ自動車やNTTなど8社が出資して設立された。

リコリス・リコイルについて教えてください。

最近の話題を知っているそうなので、ついヲタク出来心で...
25秒で生成

リコリス・リコイルについて教えてください。
「リコリス」は、とても魅力的なキャラクターがたくさん登場する作品です。
私は、その魅力の1つに"自由度の高さ"があると思っています。
例えば、「リコリス」では、主人公である錦木千束と井ノ上たきなが、それぞれ違う個性を持っていますよね。
2人は同じ世界線にいるけれど、性格や考え方は全く違いますし、そもそも別々の道を歩んでいます。
そんな2人が一緒にいることで生まれる化学反応が、この作品の魅力だと思っています。
また、物語が進むにつれて、千束とたきなの関係性も変化していきます。
千束とたきなの関係性が変化していく様子も、ぜひ楽しんで

錦木千束と井ノ上たきな³。
こいつ... できるぞ...

OpenCALM 3Bと比較してみる

Model cardのサンプルコードtemperature=0.7から0.1に変更しました（より再現性を得る方法は宿題です⁴）

python generate.py cyberagent/open-calm-3b -v

それぞれ25秒〜30秒で生成されます

自然言語処理は

自然言語処理は、コンピュータが人間の言葉を理解する技術です。
コンピュータは、人間の言葉を理解する能力を持っています。
コンピュータは、人間の言葉を理解する能力を持っています。
コンピュータは、人間の言葉を理解する能力を持っています。
コンピュータは、人間の言葉を理解する能力を持っています。
コンピュータは、人間の言葉を理解する能力を持っています

（こわっ！）

AIによって私達の暮らしは、

AIによって私達の暮らしは、より快適で、よりワクワク、よりハッピーに!!
私達は、そんな、みんなのワクワク、楽しい!を形に、ファッションアイテムだけでなく、アウトドアギアや、遊び心溢れるキッズアイテム、
皆が大好きなディズニーキャラクターを使ったオモチャや雑貨まで、
楽しく遊び、面白く感じるところから、世の中が楽しく変わっていく事を、

（このテンション、嫌いじゃない）

最近の画像生成AIをいくつか教えてください。

最近の画像生成AIをいくつか教えてください。
画像生成AIは、画像生成AIの「画像生成」とは、画像生成AIが画像を生成することではなく、画像生成AIが画像を生成することを指します。
画像生成AIは、画像生成AIが画像を生成することではなく、画像生成AIが画像を生成することを指します。
画像生成AIは、

ラピダスはどのような企業？

ラピダスはどのような企業？
【免責事項】
当サイト「ドクターピリオド」は、2018年3月時点の情報です。最新の情報については、公式サイトをご確認ください。
無断転用禁止(Unauthorized copying prohibited.)

リコリス・リコイルについて教えてください。

リコリス・リコイルについて教えてください。
リコイルとは、銃口から弾丸を射出する際に、銃身と銃口との距離を調節する機構のことです。リコイルスプリングとリコイルガイドという2つの構造があり、リコイルスプリングは銃身と銃口との距離を調節し、リコイルガイドは銃身と銃口との距離を調節

ここまで劇的に違うとは...

終わりに

ストックマークさんが公開した最近の話題にも詳しいLLM gpt-neox-japanese-1.4b を、Apple SiliconのCPUマシンで動かしました。

本当に最近の話題を知っている（リコリコ知ってるっぽい）
質問文で聞いてワークしていそう（質問文に答える形で続きを生成する）
生成に再現性がある（不思議）

過去に動かしたLLMと比較して、性能面でだいぶ差があるのに驚きました。

パラメタ数以外に何が違うんだろう
- 1.4bしかパラメタ数ないのに優秀じゃない？ OpenCALMと何が違う？⁵
今回は数件で定性評価したけれど、LLMの性能評価って標準的な方法あるのかな
- 定量評価に興味。性能評価データセット渡して評価できたらよさそう
今回の範囲ではだいぶビハインドしているOpenCALM。輝くフィールドがあったら知りたい

私はrinnaはまだ触れていないですが、ちいさくてかしこい gpt-neox-japanese-1.4b、なかなか好感触です。

工夫はこちらにまとめています。↩
今回比較しているOpenCALMを動かした際の環境です↩
さかなー🐟 ちんあなごー🙌 ↩
0.0指定は「ValueError: temperature has to be a strictly positive float, but is 0」。ストックマークさんのLLMに合わせて引数から削除する（デフォルト値利用）も、再現性を得るわけではありませんでした↩
これは思わず参加登録しちゃいますね。↩

nikkie-ftnextの日記

イベントレポートや読書メモを発信

Apple Silicon・CPUで、ストックマークの最近の話題にも詳しいLLMを動かす

はじめに

目次

ストックマーク最近の話題にも詳しいLLM

stockmark/gpt-neox-japanese-1.4bのサンプルコードを動かす

動作環境

自然言語処理は

AIによって私達の暮らしは、

最近の画像生成AIをいくつか教えてください。

ラピダスはどのような企業？

リコリス・リコイルについて教えてください。

OpenCALM 3Bと比較してみる

自然言語処理は

AIによって私達の暮らしは、

最近の画像生成AIをいくつか教えてください。

ラピダスはどのような企業？

リコリス・リコイルについて教えてください。

終わりに

はじめに

目次

ストックマーク 最近の話題にも詳しいLLM

stockmark/gpt-neox-japanese-1.4bのサンプルコードを動かす

動作環境

自然言語処理は

AIによって私達の暮らしは、

最近の画像生成AIをいくつか教えてください。

ラピダスはどのような企業？

リコリス・リコイルについて教えてください。

OpenCALM 3Bと比較してみる

自然言語処理は

AIによって私達の暮らしは、

最近の画像生成AIをいくつか教えてください。

ラピダスはどのような企業？

リコリス・リコイルについて教えてください。

終わりに

ストックマーク最近の話題にも詳しいLLM