nikkie-ftnextの日記

イベントレポートや読書メモを発信

2023-04-01から1ヶ月間の記事一覧

GWは『バグハンター2 REBOOT』を遊んで設計を学ぶぞ!(こどもの日に #ミノ駆動本 読書py番外編として1日遊ぶからみんな来て!)

はじめに リンクスタート! nikkieです。 ゲームを遊んでるだけなのに設計について学べたら最高ですよね。 そんなゲームが実在するんです、その名も『バグハンター2 REBOOT』! 遊んでみたログのアウトプットです。 目次 はじめに 目次 ミノ駆動本副教材 『…

CSVファイルが空行を含んだり、行ごとにフィールドの数が違ったりしても、Pythonのcsvモジュールは、読み込めます!

はじめに 小さな恋のうた♪ ならぬ小さな気づきの記事、nikkieです。 Pythonのcsvモジュールに関する小さな気づき(ただしここ最近のエントリをつなぐもの)の共有です。 目次 はじめに 目次 結論 解説パート:過去エントリとのつながりを明かすんだよ 裏話:…

イベントレポート | UB Tech Vol.8「ChatGPT / OpenAI API / LLM活用事例 ~ NewsPicksと朝日新聞の合同勉強会を公開」、刺激的な事例が盛りだくさんでした! #UBTech

はじめに どうか。 nikkieです。 昨日4/27(木)にオンライン開催されたLLM活用事例のLT会のレポートです。 本当に刺激的で、めちゃめちゃテンション上がりました!(神回!) 目次 はじめに 目次 勉強会の概要 アーカイブ公開されてます!(みんなぜひ見て) …

Pythonのcsvモジュールのドキュメントにあるopen(..., newline="")のススメ、やっと意味分かった...(改行文字を変換するか否かの指定)

はじめに 映画『聲の形』を久しぶりに観ました、nikkieです。 Pythonのcsvモジュールのドキュメントで、長いことよく分からなかったのですが、ようやく意味が取れた箇所があります。 その点について共有します。 目次 はじめに 目次 ずっと分からなかった、o…

ねえ、ChatGPT? Webページの本文を取得するJavaScriptで実装された関数があるんだけど、Pythonではどう書いたらいいかな?

はじめに これが、ChatGPTとのペアプロ...! nikkieです Webページの本文を取得するというめちゃめちゃステキ✨な関数の実装を見かけました。 「なにこれ、めっちゃ便利!私も使いたい!!」 その実装はJavaScriptです。 「Pythonでおんなじことできないかな…

「機械学習を使って30分で固有表現抽出器を作るチュートリアル」を写経しました

はじめに わーい、ホッテントリ、わーい!1 nikkieです。 固有表現抽出(NER)タスクをCRF(Conditional Random Fields2)で解く実装の理解を深めたく、チュートリアルで素振りしました。 目次 はじめに 目次 Hironsanによるチュートリアル 素振り成果物 チ…

あ(U+3042)はどういう規則でb'\xe3\x81\x82'というバイト列に変換される? UTF-8の変換アルゴリズムを知りました

はじめに うにおん!ならぬ、うにこーど! nikkieです。 先日ChatGPTがどのように日本語テキストをトークン化するのか覗きました。 トークンのIDから対応するテキストを見ようとPythonのbytesを扱ったわけですが、その中で感じた疑問についてアウトプットで…

ChatGPTに日本語テキストを入力するとき、日本語テキストがどのように分割されてトークンに変換されるかをtiktokenでのぞく

はじめに これも1つの願いの鍵探し1、nikkieです。 先日tiktokenデビューし、ChatGPTのAPIを呼び出さずに入力トークン長が分かるようになりました。 その中で、ASCII以外の文字(例:日本語)については、トークン(bytesオブジェクト)がそのままでは読み解…

TikTokデビューならぬ、tiktokenデビュー! ChatGPT APIに送らずして入力トークン長が分かるんです

はじめに TikTokerじゃなくて、えぬえるぴーや1なnikkieです。 久しぶりのChatGPTネタです2。 ChatGPT(やLLM)ではトークンの長さに関心が向くことがあります。 そのトークンについて、OpenAI製のライブラリtiktokenの存在を知りました3。 素振りして分かっ…

CSVファイルの行からデータクラスのインスタンスを作る(map / starmap / 辞書版自作doublestarmap)

はじめに ういっす✌️ nikkieです。 先日、CSVファイルの行を種々のデータ型に変換する実装を一覧にしました。 その中でデータクラスのインスタンスへの変換について、いろんなやり方があると気づいたので一覧にします。 目次 はじめに 目次 前提 csv.reader…

mapで変換! csvモジュールで読み込んだ行から、リスト/辞書/タプル/名前付きタプル/データクラス(のインスタンス)を作る

はじめに わりぃ、おれ、死んだ、nikkieです1。 CSV形式のファイルを読み込んで、行を各種データ型に変換する方法を一覧にしていきます! ドキュメントを見ていたら「これ、どんなデータ型にも変えられるんじゃないか」と着想を得たんですよ 目次 はじめに …

Pythonでリソースファイルと一緒にパッケージをインストールする指定は3つある 〜うち、include_package_dataとpackage_dataについて〜

はじめに サァン!!! nikkieです。 Pythonのパッケージに.py以外のファイルを含める設定について先日アウトプットしました。 知ったことを自作パッケージに適用しようとしたところ、ほかの設定方法もあることが分かりました。 深まった理解を元にアウトプットし…

Pythonでリソースファイルと一緒にパッケージをインストールするための設定値(📣MANIFEST.inが必要です)

はじめに みんなの中に私はいない1 nikkieです。 Pythonのパッケージに.py以外のファイルを含めたいことってありますよね。 これに必要な設定についてのアウトプットです。 なお、.py以外のファイルを指して、タイトルで「リソースファイル」と書きました。 …

Python標準ライブラリ ソースコードリーディング | csv.DictReaderはcsv.readerを継承じゃなくて委譲している!

はじめに ヨーソロー!1 nikkieです。 ここ数日はcsvモジュールで知ったことをアウトプットしています。 今回はcsv.DictReaderのソースコードリーディングで知ったことです。 目次 はじめに 目次 csv.DictReaderとは csv.DictReaderのソースコードリーディン…

Pythonのcsv.readerでCSVの中のダブルクォートがどう扱われるか理解する第一歩

はじめに 私的最強概念 こころおねえちゃん nikkieです。 時として厄介な形式のCSVファイルを扱わなければならないことってありますよね。 csvモジュールを使って挑んでいったのですが、読み込んだCSVでは、ダブルクォートが閉じるまでは区切り文字で分割さ…

私、csv.readerのこと、何も分かってなかったんだな... 〜Dialectなるものを完全理解〜

はじめに デカリボ、パトラッシュ、お誕生日おめでとうございます! nikkieです1 Python標準ライブラリのcsvモジュールとの付き合いが長いのですが、このたびreader(やwriter)のdialect引数の意味をようやく完全理解しました! ここにアウトプットします。…

Pythonのジェネレータ関数の返り値の型ヒントを考える

はじめに ニュージェネレーションズ! nikkieです。 Python使いのみなさん、ジェネレータ使ってますか? 私は多用しています、もう手放せません! そんなジェネレータ(を返す関数)の型ヒントについてアウトプットします。 目次 はじめに 目次 ジェネレータ…

味わう #かがみの孤城 |「オレ達、もしかして助け合えるんじゃねーのかな」(ネタバレあり)

はじめに TDKK(とっても大好き、かがみの孤城) nikkieです。 公開以来繰り返し劇場に通い1、先日原作小説も読破2した『かがみの孤城』。 映画だけでなく原作も読んだことで私の中では非常に深みが増していまして、語りたいところをネタバレありで語ってい…

pytest.mark.parametrize tips 2選 〜クラスもデコレートできる・複数積んでパラメタの組合せを自動化できる〜

はじめに 退屈なことはPythonにやらせよう1、nikkieです。 Pythonのユニットテストフレームワークの1つ、pytest。 pytestはパラメタ化したテストも可能にしてくれるのですが、パラメタ化したテストについて最近知った小さいtipsをアウトプットします! 目次 …

ミノ駆動本_読書py、1章から14章までを読破しました! #ミノ駆動本

はじめに 私たちが過ごした時間の全てが、それが輝きだったんだ1、nikkieです。 2022年からミノ駆動本の読書会を開催してきました。 先日、最終回を終えまして(祝・閉城!)、今回はこれまでの読書会をまとめます。 目次 はじめに 目次 ミノ駆動本_読書pyと…

いったいいつから異種コレクションとしての辞書が僕の中で自然になってしまったのだろうか

はじめに じっしょ じっしょ じー1、nikkieです。 『ロバストPython』きっかけで考えたことをアウトプットです。 私はこれまで、同じ型の要素を入れた辞書も、違う型の要素を入れた辞書もどちらもよく使ってきたのですが、後者にはより向く方法があると知っ…

#かがみの孤城 原作小説を読破しました(大きな感動に本当に包まれるから、みんな読んで!)

はじめに エピロおおおおおおおおおおグうううううううう、nikkieです。 昨年12月に観て1以来、とっても大好き2な『かがみの孤城』。 このたび原作を最後まで読みました! 深堀りしたい点はいっぱいあるのですが、このエントリはネタバレなしでお送りします …

読書ログ | 『機械学習デザインパターン』3.2 マルチラベルパターン

はじめに マル・マル・モリ・モリ!1 nikkieです。 機械学習関係の読書ログを残します。 取り組むことの多いマルチラベル分類について、まとまった記述のある書籍を知ったので、読みました。 目次 はじめに 目次 『機械学習デザインパターン』 シングルラベル…

読書ログ | #ちょうぜつ本 第1章 〜クリーンアーキテクチャってそういうことか!〜

はじめに 変更しやすいコードが書けないのにソフトウェア開発とか舐めているのですか1 ごめんなさい〜、nikkieです アニメも大好きな私。作品選びの軸は「かわいさ」です。 そんな譲れないポイント「かわいい」と技術書がまさかの合体をしたら、控えめに言っ…

読書ログ | 『Clean Code』第3章 〜関数でシステムを話して聞かせる〜

はじめに これはわたしのストーリー1 nikkieです。 ミノ駆動本 12章「メソッド(関数)」を機に思い出した本をあたっています。 『Clean Code』の第3章「関数」の読書ログを残します。 目次 はじめに 目次 『Clean Code』第3章「関数」 関数にシステムを語ら…

映画 #かがみの孤城 「閉城の日」フィナーレイベントに参加して

はじめに 「ようこそ、安西こころさん!お待ちしてました〜1」、nikkieです。 たまにはアニメネタを。 このブログで定期的に取り上げている映画『かがみの孤城』。 先週は作中と時間軸が重なり、イベントがあったんです! 目次 はじめに 目次 2023/03/30 「…

『ロバストPython』10章クラス、私はここを議論したい!(議論三番勝負はこの春開幕です)

はじめに 異議あり! nikkieです。 『ロバストPython』を読み始めました。 将来の開発者に意図を伝えるPythonの書き方が指南された(議論のための)本です。 10章クラスは著者(Patrickさん)の想いが込められた章とお見受けしますが、私としても議論したい…

読書ログ | #ミノ駆動本 12章「メソッド(関数)」の読書会予習に着手。メソッド設計を網羅する総復習の章!

はじめに 天海春香さん、桜坂しずくさん、吉浦康裕監督、誕生日おめでとうございます nikkieです。 『良いコード/悪いコードで学ぶ設計入門』(通称ミノ駆動本)の読書ログです。 次回のミノ駆動本_読書pyに向け、12章「メソッド(関数)」の予習に着手しま…

nikkie v2023.03 リリースのお知らせ

はじめに 「またね、こころちゃん」「うん、またね、萌ちゃん」 nikkieです1 2022年12月からリリースノートに見立てた月のふりかえりをしています。 2月のふりかえりはこちら: それでは3月のふりかえり、いってみましょー! 目次 はじめに 目次 技術まわり …

株式会社はてなに入社しました

今日みんな、はてなに入社しすぎじゃない!? どういうものかを知り、私も乗っかることにしました1。 入社したよ〜(イッツ・エイプリルフ〜〜〜〜〜ル (☝ ՞ਊ ՞)☝ウェーイ) 3月のふりかえりまとめ -> Togetterにいろいろまとめよう とやっていたら遅くなったの…