メンテナ記：SpeechRecognition 3.10.2をリリースしました🎉

タイトルが全てです！
openai-python 1.xをサポートした新バージョンをリリースしました。

前回のSpeechRecognition

音声認識ツールキットライブラリのメンテナをしています（なかなか時間を作れていませんが🙏）

openai-python 1系サポート

昨年11月にDevDay¹があり、openai-pythonライブラリのメジャーアップデートで発生していたこちらのIssue。
このたび通知に追われる形で、プルリクエストをマージしました。

（追記 2024/03/29）

pip install SpeechRecognitionするとopenai-python 1系も入ってきます。
いただいたコントリビュートにより、3.10.2からは以下のコードが動きます（3.10.1以前はopenai-pythonのバージョンを下げる必要がありました）

>>> import speech_recognition as sr
>>> recognizer = sr.Recognizer()
>>> with sr.AudioFile("english.wav") as source:
...   audio = recognizer.record(source)
>>> recognizer.recognize_whisper_api(audio)
'1, 2, 3.'

送ったファイルはこちらです：
https://github.com/Uberi/speech_recognition/blob/3.10.2/tests/english.wav

（追記終わり）

同内容のプルリクエストがたくさんあったことに気づきます。

思考メモ

私の好みのログです。
他の方がメンテナであれば、変数名など変えずにマージしたかもしれません。

命名はドキュメントのサンプルコードに寄せる。
https://platform.openai.com/docs/guides/speech-to-text/quickstart

from openai import OpenAI
client = OpenAI()

Diffを最小化。
PyCon JP 2018のLTが非常に印象に残っています。
https://gihyo.jp/news/report/01/pyconjp2018/0002?page=4#sec6_h1

diff最小化原理で導くZen of Python

スライドはこのあたり
https://github.com/ta-dadadada/pyconjp-2018/blob/d25d136089f5786cd53c005a1829cd74e2b87742/PITCHME.md#diff-%E6%9C%80%E5%B0%8F%E5%8C%96%E5%8E%9F%E7%90%86

終わりに

openai-python 1.xをサポートした新しいバージョンのSpeechRecognitionをお楽しみください！

スターやスポンサーで支えていただけるととっても嬉しいです！

応援ください！

変更履歴

2024/03/29 コード片を追加

nikkie-ftnextの日記

イベントレポートや読書メモを発信