Scribble at 2024-09-07 21:23:58 Last modified: 2024-09-07 21:37:28
山畑古墳群は、大阪府東大阪市にある、5世紀末から6世紀初頭にかけて存在した大型の古墳群です。この古墳群には、最大のものが直径約50メートルの円形の塚状の古墳で、周囲に複数の小さな古墳があります。この中でも、大きな塚状の古墳を中心とする部分が山畑5号墳と呼ばれています。この古墳群は、近鉄けいはんな線の高安駅から約1.5キロメートル西に位置し、JR奈良線の鴻池新田駅からも約3キロメートルの距離です。この地区には、大型の円形の塚状の古墳が複数存在することで知られています。この古墳群は国の史跡に指定されており、東大阪市内での最大の史跡の一つです。
試しに自宅のマシンへ LM Studio を入れてみた。会社では Google Gemma 2 2B しかロードできなかったのだが、自宅では Meta Llama 3.1 8B が問題なくロードできたので、さっそく使っている。いつものように、テスト・ケースは「山畑古墳群」についての情報をどのていど正確に答えられるかだ。ということで、上の引用が LLama の回答なのだが・・・以下の箇所は、全て間違いである。
(1) 5世紀末から6世紀初頭: 「6世紀前半から7世紀初頭」が正しい。(6世紀前半に造営されたとされている、いわゆる「A支群」と呼ばれる平地部の古墳を含む)
(2) 大型の: 「大型」の定義が分からないが、少なくとも大規模かつ広範囲に分布しているとまでは言えない。
(3) 最大のものが直径約50メートルの円形の塚状の古墳: 山畑古墳群で最大の規模は瓢箪山古墳(山畑52号墳)だが、推定では双円墳であり、直径は軸長が50メートルである。円墳としての直径ではない。
(4) 山畑5号墳: 「大きな塚状の古墳を中心とする部分」という表現で何を特定したいのか意味不明なので、直径12メートルほどの特に大きくもない5号墳について語る必要はない。
(5) 近鉄けいはんな線の高安駅から約1.5キロメートル西に位置し: 山畑古墳群はそんな場所にない。高安駅を基準にするなら、実際には高安駅の北北東5キロメートルくらいの位置にある。あと、高安駅は「近鉄けいはんな線」ではなく「近鉄大阪線」の駅だ。
(6) JR奈良線の鴻池新田駅からも約3キロメートルの距離: これも間違い。そもそも鴻池新田駅は JR の学研都市線の駅であり、鴻池新田駅を基準にするとしても、山畑古墳群はそこから5キロメートルは離れている。
(7) 国の史跡に指定されており: 国の史跡ではない。
もちろん、このような文章が出力されてしまう原因として、「山畑古墳群」と呼ばれている史跡が東大阪市の他にも何箇所かあるからで、それらの史跡に関する情報が混在してしまうのであろう。結局 AI の情報処理は言葉の「意味」を取り扱っているわけではなく、意味を表す記号の出現パターンを比較して、同時に記述される確率が高い記号を配置しているにすぎないので、そういうアンサンブルを処理するだけで有益が結果が出てくる処理(たとえば画像や音楽の生成はそうだろう)については使えるが、アンサンブルに事実と照らして正しくない表現があれば使えないという用途には不向きだと言える。
したがって、同じくテキスト処理であっても、言葉の意味についてはどうでもいいようなこと、端的に言えば時候の挨拶などは生成 AI で適当に出力しても、さほど問題にはならない。いまだと「処暑の候」と書けるが、これを「猛暑の候」(本来は8月の表現)と書いてもさほど問題にはならないだろうし、生成 AI が適当に「悪暑の候」などと出力したとしても、これはこれで「あり」だと感じる読み手がいれば通じる。こういう、形式だけで相手の様子を思いやるという本来の目的が形骸化してしまった馬鹿げた言語風習は、生成 AI に弄ばれても当然と言える。生成 AI にとっては形式だけしか興味がないからだ。