Scribble at 2021-11-19 16:30:38 Last modified: 2021-11-23 01:41:34

添付画像

Imagined by a GAN (generative adversarial network) StyleGAN2 (Dec 2019) - Karras et al. and Nvidia Don't panic. Learn how it works [1] [2] [3] Code for training your own [original] [simple] [light] Art • Cats • Horses • Chemicals • Contact me Another

This Person Does Not Exist

「実在しない人物(this person does not exist)」の写真を生成するサイトとして、いっときは Twitter などで話題となったが、(1) 何度か使ってると飽きる、(2) 生成の仕組みを理解できる人は多くない、(3) 仕組みを理解できても応用する動機を持つ人は更に少ないといった理由で、一時的な人気にとどまってしまった(これを「インターネット・ミーム」などと言ってしまう誤用が既にアメリカでも広まっているが、ミームとは流行のことではない)。その後も、やれ実在しない焼き物だの、実在しない車だの、あるいは実在しない海岸だのと、画像を使った GANs のシステムが色々と出てきては消えている。

また、このようなシステムについてはシリアライズしたデータとして考えると他の応用もできそうだが、しかし原理的な問題として「実は組み合わせた部品を復元して、誰の写真を使ったかというプライバシー情報を突き止められる」という指摘がある。そして、思ったよりも「実在しない」と言いうるほどの暗号論的に低い衝突可能性が保証されているわけでもないし、この手の問題は実は写真を細部で見分けられる機械よりも、細部を見分けられずにおおよそ似ている写真というだけで同一人物だと勝手に思い込む人間によって、差別や間違った判断のリスクが高まるのだと言っていいだろう。出力した写真と、それに近い外見の人物とで、画像認識として何%の違いがあるのかは、実は大して深刻な問題ではない。寧ろ違っていようとも、多くの人によって両方の写真(そして、それらの写真と結びつく情報)が同一人物のものだと見做されてしまうリスクの方を考えなくてはいけないのである。これも、一種の group privacy と言えるのだろう。

もちろんだが、このようなシステムで使うアルゴリズムが「教師あり」の場合、どれだけのデータを用意するかによって出力の暗号論的な衝突可能性は違ってくる。同一のシステムで全く同じ(と見做されかねない)画像を出力してしまう確率もあるのだから、これはこれで this person does not exist ではあっても、this image has never been generated とは言えないわけである。実際、僕のようにかなり頻繁に利用して画像を出力して遊んでいる人間から見れば、どうやら思ったよりも似たような画像が出力される頻度は多そうな気がする。1時間も出力を繰り返せば、「あれ?」と思う画像、つまり既に出力していた顔と殆ど変わらない画像が出てくる可能性は十分にある。僕が思うには、thispersondoesnotexist.com で使っている「教師データ」は、せいぜい数百の範囲に限られるのではないかと思う。その中から、同じ顔の向きをしている画像だけしか顔の部品の組み合わせとして使えないなら、実際に一つの顔を生成するのに使える画像なんて二桁くらいしかないのかもしれない。

つまり、このようなサイトで特筆するべきは、教師データの中から選び出すアルゴリズムよりも、寧ろ選びだした画像データを使って違和感のない1枚の画像に加工するような、調整とか修正のテクノロジーの方ではないかという気がしてくる。あと、このようなアルゴリズムを「AI」と呼ぶのはどうかと思う。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook