Scribble at 2025-12-20 09:26:20 Last modified: 2025-12-20 10:54:22
人文学オープンデータ共同利用センターが公開している、くずし字のデータ・セットである。このデータ・セットは、機械学習用のセットだけではなく、ヒトが学習するための画像もあって、古典籍から集めた「の」のバリエーションが並べられている。はっきり言って、書店で販売されている書道用の字典よりも多いから、このデータ・セットを活用すれば、歴史学や国文学の学生もくずし字の習得が効率的にできると思う。
もちろん、くずし字の OCR である「みを」というアプリケーションもリリースされメンテナンスされていて、こちらも色々なシーンで利用できる。僕のように、くずし字の訓練をしていない(でも『大鏡』くらいは写本で読みたいという意欲はある)者にはありがたいプロジェクトだ。
たいていの「理系」と称する修士レベルの小僧どもや、しょせん低レベルな確率微分方程式を理解するていどの素養しかないくせに、人文系の学科も知識も才能も文明社会には不要と豪語する、池田信夫くんや山形浩生くんをはじめとするインチキ経済・社会評論家や守銭奴、ネトウヨなど、無知無教養な連中はともかくとして、まともな教養と知性がある人々にとっては、歴史や人文系の知恵は最低でもわれわれが犬畜生や AI ていどの計算ロボットではなく、まさしく人間として生きて暮らすために獲得し、学び、理解し、そして伝達したり維持する必要がある。もちろん、個々のケースについての評価なり重要性の度合いは異なるので、たとえば『大鏡』と『源氏物語』のどちらが重要かは一概に決められないし、そもそも決めるべきでもないと言いうる(決めなくてはいけないというコンテクストは何なのかを問うのも、人文系や社会科学をまともなレベルで修めたうえで理数系のテーマにも取り組んでいる、われわれ科学哲学者の担える役割であろうとは思うが、こういうことを自覚しているまともなプロパーは、とりわけ都内でデタラメな編集者やイベント屋と一緒に騒ぐだけのインチキ分析哲学者やイカサマ科学哲学者の中にはいるまい)。