NVIDIA、文章からリアルタイムで画像生成するAI
PC Watch
59Picks
コメント
注目のコメント
GANは楽しそう、すごそうに見えてとても難しいです。もちろん、この技術は素晴らしいです。ただ、「これで何でもできるじゃん」と思われると実はそうでもないので補足します。
よくあるGANは、風景の画像を生成するというもの。これは論理的に破綻していてもそもそもが複雑な自然物なのであまり気づきにくいという性質があります。
「人の顔も生成できるじゃないか」と思われるかもしれませんが、学習データとして用いる顔画像は顔の向きや目・鼻・口の位置もばっちり調整したものを使わないといけません。また、結構違和感のある画像ができてしまいます。つい最近GANで安定的に人の画像を生成する手法を投稿したばかりなので、その研究の過程で違和感しかない顔たちを結構たくさん目にしました。
GANが何を学んでいるのか、どうやったら安定的に生成できるのかについてはまだまだ研究者が頭を悩ませているところです。