Scribble at 2025-07-31 20:40:08 Last modified: 2025-07-31 20:46:13
CommonCanvas is a family of latent diffusion models capable of generating images from a given text prompt. The architecture is based off of Stable Diffusion XL. Different CommonCanvas models are trained exclusively on subsets of the CommonCatalog Dataset (See Data Card), a large dataset of Creative Commons licensed images with synthetic captions produced using a pre-trained BLIP-2 captioning model.
いまだに「生成 AI は泥棒だ」みたいな、反ワク同然の陰謀論を口にしてる左翼とかネトウヨとか、その手の無知無教養な人々がいる。要するにこういう人たちは、自分の(不勉強な)手が届く範囲で「正義」を語れるチャンスを伺ってるにすぎないので、自分の無知を認めたくないから X などで「クリエイターの権利」だの「著作権法」だのと大声を上げているにすぎない。もちろん、クリエイターでもあり、そして学部で修士レベルの卒論を書いた法学部出身でもある、科学哲学者の僕としては、こうした些末ないざこざに巻き込まれるのは時間と才能の無駄なので御免被りたい。というわけで、クリエーティブのサイトをこちらへ移設するにあたって、著作権がどうのと喚いている人々には明白な回答を出しておきたい。
彼ら自称クリエイターと取り巻きの連中は、AI とか機械学習とか、あるいは特定のデータ・モデルや数学的な構造なども含めて、とにかく「AI」と呼ばれているものなら何でも悪であると言っており、自分たちが人種差別や部落差別と同じレベルの愚行を犯していることに気づかない。もちろん、特にナオミ・クラインのような AI を目の敵にしている左翼ライターなどは、安っぽい物書きとしてのプライドがあろうから、自分がまさか人種差別も同然の暴論を繰り返していることなど認めたくもあるまい。だいたい、アメリカやカナダの社会科学者や批評家というのは数理的な見せかけや英語でものを書いてたくさん本を売っているという表面的なことだけで知られているが、実際にはヨーロッパや中国の社会科学者などと比べたら底の浅い連中にすぎない。ジャーナルが舞台になっている昨今の学術コミュニティでは、英語を話すという研究者の数にものをいわせて活況を呈しているように見えるが、100年くらいの歴史を振り返っても理論的な水準の進展など殆どないのだ。
ということで、上に示したのは Creative Commons のメディアだけを使ってトレーニングされた拡散モデル(SDXL)なのだが、こういう法的に何の問題もない生成 AI のモデルがあることすら想像できないわけである。そして、CommonCanvas-XL をベース・モデルとして国立国会図書館のデジタル・ライブラリーに収められているパブリック・ドメインの写真データを使い、LoRA のような追加データをトレーニングして使えば、拡散モデルや機械学習の勉強なり研究に何の法的なリスクもなく画像を生成できるわけだ。当サイトで正式にコンテンツとして公開する画像生成 AI や拡散モデルの解説や論説は、こうした法的に何の憂慮もない道具立てを紹介しつつ公開する予定だ。そもそもだね、CommonCanvas-XL がリリースされたのって2年も前であって、Stable Diffusion が広く知られて普及し始めたのと殆ど同じ時期なんだよね。つまり、arXiv などの論文をきちんとフォローしていれば、こういうものがちゃんとあって、生成 AI そのものが違法であるといった議論なんて夜郎自大もいいところであることなど、既にまともな人なら知っていたのである。もちろん、道義的どころか法的にも問題があることをやっている輩はいるが(DMM とか Amazon.co.jp で AI を使ったエロ写真集を売ってるような連中)、それをもってして生成 AI を不正だと語るのは、技能実習生一人が殺人を犯したからといってベトナム人全員を犯罪予備軍のように扱うネトウヨ政党と同じであろう。