nikkie-ftnextの日記

イベントレポートや読書メモを発信

メンテナ記:SpeechRecognition 3.10.2をリリースしました🎉

タイトルが全てです!
openai-python 1.xをサポートした新バージョンをリリースしました。

目次

前回のSpeechRecognition

音声認識ツールキットライブラリのメンテナをしています(なかなか時間を作れていませんが🙏)

openai-python 1系サポート

昨年11月にDevDay1があり、openai-pythonライブラリのメジャーアップデートで発生していたこちらのIssue。
このたび通知に追われる形で、プルリクエストをマージしました。

(追記 2024/03/29)

pip install SpeechRecognitionするとopenai-python 1系も入ってきます。
いただいたコントリビュートにより、3.10.2からは以下のコードが動きます(3.10.1以前はopenai-pythonのバージョンを下げる必要がありました)

>>> import speech_recognition as sr
>>> recognizer = sr.Recognizer()
>>> with sr.AudioFile("english.wav") as source:
...   audio = recognizer.record(source)
>>> recognizer.recognize_whisper_api(audio)
'1, 2, 3.'

送ったファイルはこちらです:
https://github.com/Uberi/speech_recognition/blob/3.10.2/tests/english.wav

(追記終わり)

同内容のプルリクエストがたくさんあったことに気づきます。

思考メモ

私の好みのログです。
他の方がメンテナであれば、変数名など変えずにマージしたかもしれません。

命名はドキュメントのサンプルコードに寄せる
https://platform.openai.com/docs/guides/speech-to-text/quickstart

from openai import OpenAI
client = OpenAI()

Diffを最小化
PyCon JP 2018のLTが非常に印象に残っています。
https://gihyo.jp/news/report/01/pyconjp2018/0002?page=4#sec6_h1

diff最小化原理で導くZen of Python

スライドはこのあたり
https://github.com/ta-dadadada/pyconjp-2018/blob/d25d136089f5786cd53c005a1829cd74e2b87742/PITCHME.md#diff-%E6%9C%80%E5%B0%8F%E5%8C%96%E5%8E%9F%E7%90%86

終わりに

openai-python 1.xをサポートした新しいバージョンのSpeechRecognitionをお楽しみください!

スターやスポンサーで支えていただけるととっても嬉しいです!

応援ください

変更履歴

  • 2024/03/29 コード片を追加