nikkie-ftnextの日記

イベントレポートや読書メモを発信

2024-01-01から1年間の記事一覧

Pythonの仮想環境、最近は .venv という名前で作っています

はじめに バーンブレイバーン、アイうたじゃなくてボーボボ!! nikkieです Pythonの仮想環境、--upgrade-depsオプションを激推しするくらいヘビーユースしています。 私事で恐縮ですが、私nikkieは今般、仮想環境のお相手(=実体のディレクトリ)の名前を …

MLflow素振りの記:2.8からサポートされたLLM-as-a-Judgeを触る

はじめに あらたなユーフォニアム...!! nikkieです。 MLflowを触ってみました。 なんでもLLM-as-a-Judgeができると聞きまして 目次 はじめに 目次 「静的データセットで評価する」のコードを動かしてみる MLflow 2.8 リリースブログより 動作環境 & スクリ…

読書&写経ログ | #ちょうぜつ本 第8章 Visitorパターン 〜Sphinx拡張開発の経験、そういうことだったのか!〜

はじめに 変更しやすいコードが書けないのにソフトウェア開発とか舐めているのですか 天使様、ごめんなさい〜、nikkieです1。 「かわいい」と技術書が夢の合体を果たした、ちょうぜつ本(『ちょうぜつソフトウェア設計入門』2)! 昨年から読書会を共同主催…

5/7(火) pixivさんオフィスでの #エンジニアニメ でアニメから得た学びを話します。にしこりさんのお話も聞けるぞ!

はじめに 俺が要石なんだ、nikkieです。 タイトルがすべての登壇お知らせ記事です。 5/7はpixivさんのオフィスで僕と握手! 目次 はじめに 目次 エンジニアがアニメから得た学び わーい!にしこりさんのお話が聞けるぞ〜 野良LTもできるよ! アニメトークす…

ことみんさんによる「エンジニア基礎 ウィルゲート2024年度エンジニア新卒研修」。読んでいて「それな!」祭り👏 これはマジで受けたい!

はじめに トワラー、めっちゃいい nikkieです。 研修「エンジニア基礎」資料が話題です。 200ページを超えるスライドを読んでのメモ、「それな!」祭りです。 目次 はじめに 目次 エンジニア基礎 ウィルゲート2024年度エンジニア新卒研修 エンジニア基礎の見…

『大規模言語モデル入門』8章で文埋め込みの理解を更新。単語埋め込みの平均じゃないんですね!

はじめに 色打掛は花嫁衣装、nikkieです 文埋め込み(文のベクトル)について、理解を更新したメモです 文埋め込み同士の距離は意味の類似度を表す (理解 NEW!!)文埋め込みは特徴量として使える (理解 NEW!!)文埋め込みは、単語埋め込みの平均ではない …

flake8(pycodestyle)には、二項演算子と改行について、排他的なルールがある(W503とW504)

はじめに 枕木の歌、いいよね... nikkieです。 flake8を触っていての気づきを書いていきます。 目次 はじめに 目次 相互に排他的な W503 と W504 2つある経緯は、PEP 8の変更 顕在化するのは、--ignoreオプションと使った時 終わりに P.S. Ruffでは? 相互に…

株式会社はてなに入社しました

入社したよ〜(イッツ・エイプリルフ〜〜〜〜〜ル (☝ ՞ਊ ՞)☝ウェーイ) 2年連続、2回目の入社。 つまり連覇です! 初入社はこちら ルーツはこちら みんな、今日ははてなに入社していきましょう!

聞いて聞いて! 4/20(土)にハイブリッド開催の VS Code Conference Japan 2024 に登壇します #vscodejp

はじめに かがみの孤城、ありがとう 閉城の日上映行ってきました、nikkieです このエントリは、タイトルが全てです。 今年も1VS Code Conferenceでお話ししちゃいますよ〜 目次 はじめに 目次 VS Code Conference Japan 2024 イベント紹介(先日のMeetupより…

登壇報告 | #ooc_2024 にて、"ソフト"ウェアに憧れた過去の私に向けて、変更しやすいコードを書くコツを共有しました #ooc_2024_d

Object-Oriented Conference 2024、素晴らしいカンファレンスをありがとうございました!1 このエントリは、タイトルが全てです。 目次 目次 ソフトウェアを作りたかった私へ 〜変更しやすいコードを書くコツが見えてきた今伝えられること〜 資料類 発表中の…

Markdownファイルの内容でNotionにpageを作る(JavaScript & Python)

はじめに THE・年度末! nikkieです。 先日PythonでNotionにpageを作るHello worldをしました。 今回はMarkdownファイルの内容と同じpageを作ります! 目次 はじめに 目次 前回:PythonでNotionにpageを作る Markdownファイルの内容でNotionにpageを作る Mar…

メンテナ記:SpeechRecognition 3.10.2をリリースしました🎉

タイトルが全てです! openai-python 1.xをサポートした新バージョンをリリースしました。 目次 目次 前回のSpeechRecognition openai-python 1系サポート 思考メモ 終わりに 変更履歴 前回のSpeechRecognition 音声認識ツールキットライブラリのメンテナを…

PythonでNotionにpageを作る(環境設定 & Hello World)

はじめに ハミングバード!1 nikkieです。 Notionで、あるpageの下に子のpageを作る自動化を試しました。 目次 はじめに 目次 あるpageの下に子のpageを作る インテグレーション インテグレーションの作成 親pageをインテグレーションに共有する notion-clie…

スキャンされたPDFを画像にして(pdf2image)、Tesseractで読み取る

はじめに あなたのライブラリーから、点数で見たマナ・コストがX以下のアーティファクト・カードを1枚探し、それを場に出す。1 nikkieです。 異常系への対応という文脈になりますが、PDFにもOCRを適用できるんです! 目次 はじめに 目次 pdfminer.sixでPDF…

macOSでTesseractをPythonから呼び出し、画像内の日本語テキストを検出する

はじめに アーティファクトを最大2つまで対象とし、それらをアンタップする。1 nikkieです。 OCR(光学文字認識)ソフトウェア Tesseract をPythonから触ります。 目次 はじめに 目次 前回のTesseract! pytesseract pytesseractで、画像内の日本語テキスト…

macOSでTesseractをインストールし、画像内の日本語テキストを検出する

はじめに アーティファクトを最大2つまで対象とし、それらをアンタップする。1 nikkieです。 OCR(光学文字認識)ができるソフトウェア Tesseractの触り出しログです。 目次 はじめに 目次 Tesseract macOSにTesseractをインストール 日本語を扱えるように…

分かち書きした日本語テキストからROUGEをデフォルトで算出できる kurenai (紅) 0.0.1 をリリースしました💄

リリース報告エントリです。 kurenai(紅・くれない)をご紹介! 目次 目次 kurenai 0.0.1 なぜkurenaiを作った? 設計:rouge-scoreを薄くラップする kurenaiの今後(TODOリスト) 終わりに kurenai 0.0.1 pip install kurenai >>> from kurenai.rouge_scor…

#かがみの孤城 はまさしく、かがみの、孤城🪞🏰(ネタバレあり)

はじめに 関係者面パーティー!1 nikkieです。 2022年末に公開された映画『かがみの孤城』、原作小説ともども非常に刺さり、このブログで何本も記事を書いてきました2。 最近ふとタイトルがすっごくよくできてるなと気づき、それを記事にします。 ※この記事…

ソフトウェアを作りたかった私へ:作ると使うを分ける

はじめに よければポチッとお願いします! 味ついてておいしいです!nikkieです。 週末3/24(日)のOOC 2024 登壇1準備からアウトプットです。 目次 はじめに 目次 わからん殺し「APIに絡む処理を、小さめの関数としてまとめたはずなのに...」 ちょうぜつ本 第…

Mixinを継承したクラスを動的に生成する機能を提供して、Sphinx拡張開発を簡単にする 襲(sphinxcontrib-extdevhelper-kasane)をリリースしました👘

リリース報告エントリです。 sphinxcontrib-extdevhelper-kasaneが爆誕しました! 目次 目次 sphinxcontrib-extdevhelper-kasane(現在 0.2.0) kasaneに至るまで kasaneが提供するSphinx拡張開発体験 終わりに P.S. 機を同じくしてsphinx-revealjsのattakei…

ソフトウェアを作りたかった私へ:入出力と計算を分ける

はじめに 百合子ちゃん、お誕生日2日目、おめでとうございます!! nikkieです。 週末3/24(日)のOOC 2024 登壇1準備からアウトプットです。 目次 はじめに 目次 わからん殺し「小さめの関数としてまとめたはずなのに...」 増田さんのスライド「入出力と計算…

Python 春の勉強会まつり 2024

はじめに 百合子ちゃん、お誕生日おめでとうございます!! nikkieです1。 PHPコミュニティの盛り上がりを指して「月刊PHPカンファレンス」とはうまい言い回しだと思います2。 私の手に馴染む言語であるPythonの界隈も、勉強会が結構目白押しになってきたの…

Pythonのvenvの--upgrade-depsオプションは、どこから来てどこへ行くのか

はじめに ぶっ飛ばせ!! nikkieです 先日言語処理学会でPython仮想環境の話題があり、以下のツイートに多くの反響をいただきました。 情報量を増やした記事を書きます。 ただし、すぐ役に立つ部分で言うとツイートを超える情報はなく、なぜこのオプションが…

pytestのフィクスチャを共有したいときはconftest.pyを使いましょう(ゆめゆめimportしようとなされるな)

結論(『テスト駆動Python 第2版』より) 複数のテストファイルでフィクスチャを共有したい場合はconftest.pyファイルを使う必要があります。(Kindle版 p.95) 第3章でフィクスチャが詳しく解説されています 目次 結論(『テスト駆動Python 第2版』より) 目…

rouge-scoreライブラリが日本語テキストからROUGEを算出できないのはなぜ? デフォルトでは英数字以外を除く挙動でした

はじめに ちはやぶる 神代も聞かず 竜田川、nikkieです。 ライブラリrouge-scoreをそのまま使うと、日本語テキストのROUGEは算出できないことを知りました。 目次 はじめに 目次 rouge-score サンプルコード Hugging Face Spacesで触る 分かち書きされた日本…

pdfminer.sixでPDFを読み取る(extract_textにパスを渡すだけととっても簡単です!)

はじめに アクアトープ16話、やっぱりよい nikkieです。 pdfminer.sixというライブラリを素振りしました。 目次 はじめに 目次 PDFの内容を読み取りたい pdfminer.six extract_text! Dockerイメージでも試してみる 宿題:読み取れないPDFもあるみたい 終わ…

ソフトウェア開発の一側面:摩擦を減らし続ける

XP

はじめに お 姉 さ ん nikkieです 学マスに持ってかれてないで、本日の一本。 「Refactoring -- Not on the backlog!」の感想を書いたのをきっかけに気づいたことを書き散らします。 目次 はじめに 目次 前提:「Refactoring -- Not on the backlog!」感想 …

Ron Jeffries氏による「Refactoring -- Not on the backlog!」がしっくり来ました🪴

XP

はじめに 剃刀境の茂み、nikkieです。 存在を教えていただいた「Refactoring -- Not on the backlog!」の感想エントリです。 非常にしっくり来ました。茂み! 目次 はじめに 目次 Refactoring -- Not on the backlog! 思い出したもの 二つの帽子(『リファク…

Python公式ドキュメントをローカルでビルドする

はじめに venvの--upgrade-depsをよろしくね! nikkieです。 みなさん、Pythonのドキュメントを手元でビルドしたくなることってありますよね?? ということでやってみましょう! ※本記事はすぐどこかで役に立つことはない部類の一本と思われます 目次 はじ…

LLMを使って画像やPDF中のテキストを構造化。知ってる事例まとめ(2024年3月時点)

LLM

はじめに (お財布が)試される仕掛け人、nikkieです。 テキストを含んだ画像をLLMで扱い、情報を取り出す時に参考にできそうな事例をここに書き出します。 目的は知っている事例の整理です。 試行錯誤に進むうえで一度書き出します。 テキストを含む画像の…