言語判定と音声認識は既に一定レベルの技術があり、MicrosoftやIBM等でAPI提供されていますね。 それよりスゴイのは、二人同時には話した音声を1本のマイクで拾っていること。これは音声分離と呼ばれる技術ですが、なかなか分類性能が出ないものです。男声と女声に分かれているのもポイントかもしれません。
マイニュースに代わりフォローを今後利用しますか