Scribble at 2026-02-25 09:29:46 Last modified: unmodified
「巧妙」と言えるほどではないのだけれど、実際にさくらインターネットから送ってくるメールの件名や本文のフォーマットに似せてあって、それなりによく出来ているとは思う。ただ、こんなものに騙されるようでは AI 以下だと笑っていればいいかもしれないが、こういうメールを生成 AI で量産させるためには、もちろんモデルにトレーニング用の教師データを与えて学習させなくてはいけない。ビジネスで送信されているメールを、教師データとして有効にトレーニングさせられるていどの分量で確保しないといけないのだから、そういうメールの出どころが何なのかという懸念はあろう。
たとえば、さくらインターネットのサイトに、色々な目的で配信されるメールの文面がサンプルとして大量に公開されているのかというと、そういうわけでもない。こうした偽のメールに対する注意を促す「『なりすまし・フィッシング詐欺などの迷惑メール』『偽サイト』にご注意ください」というページでも、メールの文面の事例は全て画像として掲載してあり、生成 AI の学習データとしては簡単に流用できなくなっている(特に署名欄を削ってあるのは正しい)。
したがって、このような偽メールを生成 AI に書かせるために教師データとして使われているのは、恐らく受信側の組織や個人から漏洩したメールのデータであろう。レンタル・サーバを契約して数年ほど利用するだけでも、さくらインターネットからは色々なメールが送られてくるから、たった一人のユーザから漏洩したメールだけでも数十通の教師データが手に入る。この手のテンプレートを学習して量産するだけなら、恐らく50通もあれば十分だろう。そして、個人のパソコンから漏洩したメールなんてものは、はっきり言ってダーク・ウェブでは大した価格にもならず大量に手に入るはずで、つまるところテンプレートを使ってメールを送信している企業に、こういう偽メールを作成させない方法というものはない。