Scribble at 2024-01-05 19:04:45 Last modified: 2024-01-06 16:37:48
自分自身の写真を素材にして LoRA ファイルを作ったことがあるけれど、それはもう半年くらい前だったので、もう少し丁寧に素材の写真をトリミングしたりタグを付け加えてみようと思って、Kohya_ss と Kohya_ss GUI というツールを入れ直してみた。今回は GUI のツールを入れることで、かなり手軽に設定はできるようになったのだけれど、パラメータが複雑だし、トレーニングを更にしっかりやろうとすると、予想通りメモリと時間がたくさん必要となる。
おおよそ、僕の環境ではバッチ・サイズを大きくとるとメモリ不足で動かないため、これは1にするほかはない。しかし、だからといって代わりにエポック数を増やすとアホみたいにトレーニングの時間が増大する。たとえばエポック数を5にするだけでも、20枚ほどの写真で50ステップの学習に8時間ほどかかるため、これではマシン・パワーの浪費である(それに、それをやってるあいだは Becky や WinSCP などのウィンドウが正しく描画できなくなり、仕事どころかプライベートの用途でも並行した作業ができなくなる)。ということで、このマシン(Ryzen 5 + 16 GB RAM + GeForce RTX 2060)でトレーニングするのは(更に良好な LoRA を作るなら)現実的ではないということになる。