タイトルが全てです!
openai-python 1.xをサポートした新バージョンをリリースしました。
目次
前回のSpeechRecognition
音声認識ツールキットライブラリのメンテナをしています(なかなか時間を作れていませんが🙏)
openai-python 1系サポート
昨年11月にDevDay1があり、openai-pythonライブラリのメジャーアップデートで発生していたこちらのIssue。
このたび通知に追われる形で、プルリクエストをマージしました。
(追記 2024/03/29)
pip install SpeechRecognition
するとopenai-python 1系も入ってきます。
いただいたコントリビュートにより、3.10.2からは以下のコードが動きます(3.10.1以前はopenai-pythonのバージョンを下げる必要がありました)
>>> import speech_recognition as sr >>> recognizer = sr.Recognizer() >>> with sr.AudioFile("english.wav") as source: ... audio = recognizer.record(source) >>> recognizer.recognize_whisper_api(audio) '1, 2, 3.'
送ったファイルはこちらです:
https://github.com/Uberi/speech_recognition/blob/3.10.2/tests/english.wav
(追記終わり)
同内容のプルリクエストがたくさんあったことに気づきます。
- Fix: modify `recognize_whisper_api` according to the new version of the OpenAI API by ramoncorominas · Pull Request #736 · Uberi/speech_recognition · GitHub
- https://github.com/Uberi/speech_recognition/pull/713
- https://github.com/Uberi/speech_recognition/pull/725
思考メモ
私の好みのログです。
他の方がメンテナであれば、変数名など変えずにマージしたかもしれません。
命名はドキュメントのサンプルコードに寄せる。
https://platform.openai.com/docs/guides/speech-to-text/quickstart
from openai import OpenAI client = OpenAI()
Diffを最小化。
PyCon JP 2018のLTが非常に印象に残っています。
https://gihyo.jp/news/report/01/pyconjp2018/0002?page=4#sec6_h1
diff最小化原理で導くZen of Python
終わりに
openai-python 1.xをサポートした新しいバージョンのSpeechRecognitionをお楽しみください!
スターやスポンサーで支えていただけるととっても嬉しいです!
変更履歴
- 2024/03/29 コード片を追加