「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました
コメント
注目のコメント
楽しみな連載です。
脳波(EEG)から高品質な画像を生成する学習モデル「DreamDiffusion」に驚きました。ここまで進んでいたのですね。しかも非侵襲で。この分野,展開が早すぎて旧来の学術論文での発表というのが必ずしも適さなくなってきてしまっているそうです.
元々ジャーナル論文の査読では遅すぎるからということで,国際会議のプロシーディングスが重視されていたようですが,それでも投稿から査読を経て発表するまでに半年くらいのタイムラグがあるので,その間に大量の新サービスがでてきてしまい,発表する頃には古い感じになってしまうこともあるとか.
(ChatGPT発表前に投稿された大規模言語モデルベースの研究とか,発表時には新しさを感じられなくなっていたと聞きました)
追いかけるのも大変なので,こういうまとめは大変良いですね.#気になった論文
- 「Drag Your GAN」 画像内の任意の2点と編集範囲を指定することで思い通りの画像を生成できるGAN。顔の向きを変える、服の袖を伸ばす、といったことが可能。拡散モデルを使った改良版も存在。(https://vcai.mpi-inf.mpg.de/projects/DragGAN/)
- 「MotionGPT」 プロンプトを与えることで、指定動作を3Dモデルで生成できるモデル。高い忠実度で3Dモーションが生成されているが、手や頭などの詳細な部位の再現度はあまり高くない。ProjectPageが綺麗(https://motion-gpt.github.io/)
#感想
生成AIは進歩が早いのでこうやってまとまっている記事はとても参考になる。論文だけでなく、ProjectPageやHuggingFaceのURLもまとまっているので、とてもありがたい。次の動作に移りやすい。