Scribble at 2024-11-07 09:45:15 Last modified: unmodified
Meet your AI document analyst
AI を利用して PDF もテキスト・データに変換してソースにしようというサービスは、もちろん当サイトでも紹介した(そして僕が常用しつつある)NotebookLM のように、かなり強力なツールとなりつつある。実際、学術研究においても雑に論文をサーヴェイするだけなら、こういうサービスにどんどん PDF を放り込んでいけば、概要や基本的なポイントを即座にまとめてくれるし、男女の会話に仕立てたポッドキャストのようなものまで作ってくれる。詳細な内容は実際に読まなくてはいけないが、そもそも読むべきかどうかを判断しなくてはいけないという事情があるからには、あらかじめこれだけの精度で概略がつかめるというのは非常に助かる。
ただ、生成 AI には常にプロンプト数の上限という問題があって、あまりにも長く会話を続けると生成 AI は一度に処理できるデータ量に限度があるため、どんどん最初に入力した情報を忘れていく。これは、先にも述べたように、一定のタイミングでそれまでの対話をまとめ直してコンテクストとして AI に提示することで会話を続けていくという工夫ができる。しかし、これも万全ではない。過去のやりとりを全て記憶した上で対話を続けてほしい。そうでないと、せいぜい少しできがよい学生みたいな相手と対話しているだけになってしまう。
もちろん、これは拡散モデルに対して、こちらで用意したソースをもとに再トレーニングなり fine tuning することで解決はする。だが、おそらく僕らが利用している NotebookLM や Llama といったモデルを再トレーニングするだけのコストは、個人としては厳しいものになる。AWS の SageMaker や BedRock などを使うと非常に簡単に環境を整えられるが、どれだけのプロンプトで、どういう計算機を選ぶかにもよるが、そんな論文1本ごとに実行できるほどの気軽なコストでは利用できない。もちろん、東大暗記小僧である哲学プロパーの半分くらいは成金だろうから、月額で数千万円の費用がかかっても小遣い銭ていどだろうとは思うので、ぜひチャレンジして成果を出してもらいたい。