新着Pick

雑音の中でも…AIが複数の人の会話聞き分けて書き起こし リアルタイムで議事録作成OK NTTが開発

産経ニュース
NTTは、大きな雑音の中でも必要な音声を認識して正確に書き起こすことができる人工知能(AI)技術を開発した。複数の人の会話を発言者ごとに聞き分けることも可能で、会議の議事録をほぼリアルタイムで作成することができるようになるという。1~2年後の実用化を目指す。
341Picks
Pick に失敗しました

選択しているユーザー
これをAIというか機械学習というか。何にせよ、使える技術が増えるのは喜ばしいことです。
人気 Picker
実際には言葉を入力するのに、キーボードであいまいさなく入れて漢字に変換するのでさえ、意図通りにはならないのが現状。普通の人が描く夢と現実はギャップがあります。
 人の話は、アナウンサーの原稿読み上げから日常会話まで、スペクトルが広い。前者に近い場合は、書き起こしはかなりいけるだろうが、後者に近い場合は、実は、その場の文脈や常識を前提にしているところが多く、これを書き起こすのは、門外漢の人間にさえ難しい。まして機械には、当面むりだろう。それでも役立つ場面はいろいろあるが。
インタビューの仕事が多いので、音声認識&書き起しアプリを探しておりましたので、この技術の完成度が気になります。今でも音声入力アプリはあるけど精度がいまいちだったりしてもので(おすすめアプリあったら教えてください!)

録音しているとはいえ、やはりインタビューなり会議では”要点”の書き出しが重要です。そこはインタビュワーの腕の見せ所ですので。
うろ覚えの固有名詞を修正してくれたり、そこもAIがカバーしてくれたらかなり画期的ですね。
ついに自動議事録取り機が!
これで全文書き起こししてくれ、それを構造化、整理したりするのが人間の役割になるとよいですね
これって、人間が持っている「カクテルパーティ効果」(?)というやつでしょうか?
たくさんの人達が集まっているカクテルパーティでも、特定の人の話している内容はしっかり聞こえるというものでしたっけ。

まさに「点と線」
人間は、見たいものしか見えない。
聞きたいことしか聞こえない。
これASIMO君も出来るって事だし、NECと京大が長年作ってきましたが、こちらと比較して精度は大きく変わったんでしょうかね。
http://jpn.nec.com/voicegraphy/necvsol.html
これが普通になってくると面倒な業務が減る企業が多そう。需要は大きいだろう。
いいですね。この技術以上に重要なことはホワイトカラーの生産性の刷新です。仕事の進め方そのものを刷新する必要があります。この技術はそれほど生産性を改善するものではないです。
これが、クルマの中で、風切り音もOKなら凄いのだが。
なんでもできるは不要なので、音声認識もジェネラルな汎用化を狙わずに、スペシフィックに特化したものにするのであれば価値はあるでしょうね。
電話会社として研究に力を入れていたNTTの音声認識技術はずっと世界最高級でした。AIにサポートしてもらって、その力を世界に発揮してほしい。
日本電信電話株式会社(にっぽんでんしんでんわ, にほんでんしんでんわ、英語: Nippon Telegraph and Telephone Corporation、略称: NTT)は、日本の通信事業最大手であるNTTグループの持株会社。持株会社としてグループ会社を統括するほか、グループの企画開発部門の一部を社内に擁し、規模的にも技術的にも世界屈指の研究所を保有する。 ウィキペディア
時価総額
14.8 兆円

業績