Scribble at 2023-12-22 08:42:26 Last modified: 2023-12-22 14:53:50

添付画像

年末年始の読書プランというのは幾つかあるのだけれど、ジュンク堂で眺めてみて、テクニカルな議論は十分にフォローできないとしても、上の二冊はぜひ読みたい。

・『拡散モデル データ生成技術の数理』(岡野原大輔、岩波書店、2023)

・『大規模言語モデル入門』(山田育矢, 鈴木正敏, 山田康輔, 李凌寒、技術評論社、2023)

あと、もちろんテクニカルなテーマとして attention, xFormers, PyTorch などを扱った本にも目を通しておきたいのだが、これらは今後の(予算という問題もあるので)予定である。

それから、『大規模言語モデル入門』についてアマゾンではプロパーなのか学生なのか知らないが「古い」という意見があって、いや特定の時点で達成された成果を元にしてるんだから、プロパーがいま現在やってる研究に比べたら、どんな本も常に絶対に古いのは理工系の本なら自明のことなんだよね。そんな高校生でも知ってる話をしてマウントを取った気になってる自称理系くんみたいなのが、こういうホットな分野だとすぐに湧いてくるんだよ。

アマゾンのレビューではお馴染みのことだけど、こういう的外れなレビューを書いていい気になってる連中というのは、そもそも本書が概論あるいは入門書であることを無視して、学術研究書であるかのような基準で評価しているところに問題がある。それって、実はプロパーとして他人の論文のレフェリーをしたり、著書の査読をするときでも資質を問われるような話なので、ようするにそういう連中は学術研究者としての基本的な能力がないのだ。国公立大学の博士課程で学んだ俺が保証するよ。そういう人たちの、表面的にはテクニカルなことを言ってて専門家の意見みたいに見えるかもしれないけど、そんなレビューなんて無視してもよろしい。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook