Scribble at 2024-06-18 19:13:10 Last modified: 2024-06-19 07:02:54

生成 AI や LLMs にかかわるニューズは、その大半を既存の報道メディアやソーシャル・ブックマークなどで目にしている。いまのところ、あまり信用に値する専用のメディアがないと思えるからだ。そもそも、いま検索してヒットする「生成 AI ニューズ」のサイトなんて、その大半が、それこそ生成 AI を使って記事を吐き出しているだけの劣悪な、「メディア」とも呼べないようなカスだ。なぜなら、生成 AI がブームとなる2年前よりもっと前から、ウェブ・スクレイピングと自動翻訳とテンプレートとを組み合わせて、適当な作文を自動で吐き出す「いんちきメディア」というのが、色々な分野に乱立していたからだ。やれ医療、やれパソコン部品、やれヘイト(嫌韓、嫌中、たまに嫌米などなど)、やれ開発言語、やれゲーム、やれ AV 作品、やれ・・・とにかくアクセスを集められて、その後のクロージングにビジターを送り出せそうなネタであれば、なんでも自動処理されたゴミが溢れかえっていた。それらのゴミを吐き出す手法と、それから SEO 業者のディストリビューション・スパム、つまり、乱立させた「サテライト」と呼ばれるコピー・サイトから特定のサイトにリンクしてページ・ランクを不正に上げるといった手法とで、検索サイトの結果を長期間にわたって汚染し続けてきた。

したがって、早慶レベルの大学で毎年のように提出される卒論と同じ質や量の「落書き」を小学生が生成 AI を使って数分で吐き出せる時代ともなれば、それなりの文章が掲載されているとしても、簡単に信用することはできない。ただ、学部レベルの学生とは比較対象にもならない、博士課程に進んだ者から見れば、学術的な水準で言えばあまりにも均一な精度の文章だとか、その分野の思想として一貫性があるとは思えない、高度な支離滅裂さというのは、生成 AI で出力された文章だと疑える。

ただ逆に、人が書いている記事を並べたサイトというのは、少なくとも日本のサイトを見ている限りで言えば、皮肉なことだが記事の品質が低すぎるという特徴がある。些末としか言いようがないカンファレンスやサービスの見本市の開催情報だとか、どう考えても機械学習の初歩も知らない高校生や主婦が既存の大手 AI サービスのニューズ・リリースからコピペしたとしか思えない聞き書きなどだ。つまり、いまだに専門のスタッフを抱えて、学術からビジネス、そして一般の利用者までをカバーするような品質や財務を擁しているメディア企業というのはないわけで、AI ビジネスにいっちょかみして小銭稼ぎをしようなんていう、都内のガキが暇潰しに起業したような、WordPress で5分くらいで作ったようなニューズ・サイトばかりがウジ虫のように大量発生している状況だ。

よって、いまのところは既存の大手メディアが報道しているニューズを眺めたり、Hacker News や Reddit などで投稿され、それなりに大きな反響を集める話題だけに注目しておけばよいだろうと思う。どのみち、それ以外のマニアックなサイトや先進的な論文を読もうとしても、学部レベルの数学や情報科学の素養では理解不能だと思う。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook