Scribble at 2024-11-27 19:45:25 Last modified: unmodified

ローカルで動かせる、日本語への対応を重視した OCR だという。サンプルを見る限りは優秀なようで、応用の幅は色々とあるだろう。僕は使う必要を感じないが（OCR を使ってまでテキストにしたい画像データが、そもそもない）、ぜひ活用したい人も多いとは思う。まぁ・・・サイトに画像でメール・アドレスを掲載してる会社とかは、せいぜいスパム業者や名簿屋に悪用されないよう祈ることだが、もちろん祈ったところで犯罪者やオンライン・ゴロツキが悪事を止めるはずもないので、やはりこういうことは自衛しかない。いまどき、JavaScript で文字列を合成するなんて子供騙しも通用しないわけなので、たとえば、(1) OCR 解析が困難なくらいコントラストを下げるとか、(2) 特殊な眼鏡でしか読めないような変形させた図に変換するとか、(3) あるいは復号鍵も掲載してわざと暗号化するとか。いや、冗談じゃなくて。

冒頭に戻る