新着Pick
78Picks
Pick に失敗しました

人気 Picker
私のようにラップトップの内蔵カメラではない外部カメラを使っていたり、多くの人がそうだと思いますが、外部モニターを使っているケースなどはどうしても目線の問題が出てきてしまいます。おそらくそのうちウェブカメラに内蔵されるんでしょうね。楽しみ。
席をはずしても顔だけのこっていてほしいですね..
実は似たような発想は深層学習が登場するよりも前、というか30年以上も前にmodel-based codingという名前で提案されています。

Model-based analysis synthesis image coding (MBASIC) system for a person's face
K Aizawa, H Harashima, T Saito
Signal Processing: Image Communication 1 (2), 139-152, 1989


また、顔の方向補正や視線一致の問題は長年の課題でありました。ハーフミラーを使って物理的に視線を一致させるものや、手前味噌ではありますが、RGBDカメラを使って顔の3次元モデルを作って正面顔を合成するものなどがあります(結構驚かれることが多いですが私は昔は3Dの研究をしていたんです)。

8.テレビ会議に関わる人間要因(ヒューマン・ファクタ)【映像1】
https://www.vtv.co.jp/intro/tech/beginner2/mr-okubo08.html

RGB-Dカメラを使用した顔モデルのリアルタイム生成・合成による顔向き補正
山崎 俊彦, 中村 新芽, 相澤 清晴
https://www.jstage.jst.go.jp/article/itej/69/8/69_J231/_article/-char/ja/


ただ、このNVIDIAの手法は頷きたいときや、顔を横に振りたい時にまで方向を補正してくれてしまう気がします。あと、頬杖をついていたりすると現時点では破綻しそうですね。
ここまで来ると適当な自分の映像を出しっぱなしにしておくのとの差が段々わからなくなってきますね...
一方で,スクリーンを複数使っていると,顔がカメラの方を向かなかったりするので,そういうのを適度に補正してくれる機能はあると嬉しい気もしますが
デモ動画をみると、視線が合っていないので、違和感が強いですね。

この技術を使うのか、普通の顔面マッピングを使うのか選択肢は多いです。

私は、自分が発言しないセミナーなどでは、一端、中座することなどが見えないように、黙って聴いている時の動画を準備しておいて、それを「仮想背景」で選んでおきます。

そうすると、普通に聴いているように見えます。社内会議などに悪用しないでくださいね。笑

※個人的な見解であり、所属する会社、組織とは全く関係ありません
最後の方にある動画が面白いです、ぜひ!