Scribble at 2023-10-05 19:34:52 Last modified: 2023-10-06 09:59:07
あまりにも分散モデルのデータがでかすぎて、普通のパソコンではローカルで動かせるものではない。よって、こういう説明でしか推し量れないところが多いわけだけど、なんとなく中途半端な感じがするんだよね。性能を発揮するには英語の能力が必要(分散モデルだけじゃなくて、それを使う人間も)というなら、最初から英語の性能だけで OpenAI や Meta と勝負したらいいんじゃないのかね。たかが1割も日本語のデータをトレーニングに使ってないのに「日本語の性能が凄い」とか言われてもねぇ。ということは、国内で日本語のデータでトレーニングしてる大半の LLM はゴミだってことじゃん。こんなのに負けてるんだから。