Scribble at 2023-10-05 19:34:52 Last modified: 2023-10-06 09:59:07

あまりにも分散モデルのデータがでかすぎて、普通のパソコンではローカルで動かせるものではない。よって、こういう説明でしか推し量れないところが多いわけだけど、なんとなく中途半端な感じがするんだよね。性能を発揮するには英語の能力が必要（分散モデルだけじゃなくて、それを使う人間も）というなら、最初から英語の性能だけで OpenAI や Meta と勝負したらいいんじゃないのかね。たかが１割も日本語のデータをトレーニングに使ってないのに「日本語の性能が凄い」とか言われてもねぇ。ということは、国内で日本語のデータでトレーニングしてる大半の LLM はゴミだってことじゃん。こんなのに負けてるんだから。

もっと新しいノート <<
>> もっと古いノート

冒頭に戻る