Scribble at 2024-11-27 19:45:25 Last modified: unmodified

添付画像

YomiToku は日本語に特化した AI 文章画像解析エンジン(Document AI)です。画像内の文字の全文 OCR およびレイアウト解析機能を有しており、画像内の文字情報や図表を認識、抽出、変換します。

YomiToku

ローカルで動かせる、日本語への対応を重視した OCR だという。サンプルを見る限りは優秀なようで、応用の幅は色々とあるだろう。僕は使う必要を感じないが(OCR を使ってまでテキストにしたい画像データが、そもそもない)、ぜひ活用したい人も多いとは思う。まぁ・・・サイトに画像でメール・アドレスを掲載してる会社とかは、せいぜいスパム業者や名簿屋に悪用されないよう祈ることだが、もちろん祈ったところで犯罪者やオンライン・ゴロツキが悪事を止めるはずもないので、やはりこういうことは自衛しかない。いまどき、JavaScript で文字列を合成するなんて子供騙しも通用しないわけなので、たとえば、(1) OCR 解析が困難なくらいコントラストを下げるとか、(2) 特殊な眼鏡でしか読めないような変形させた図に変換するとか、(3) あるいは復号鍵も掲載してわざと暗号化するとか。いや、冗談じゃなくて。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る