雑音の中でも…AIが複数の人の会話聞き分けて書き起こし リアルタイムで議事録作成OK NTTが開発
NTTは、大きな雑音の中でも必要な音声を認識して正確に書き起こすことができる人工知能(AI)技術を開発した。複数の人の会話を発言者ごとに聞き分けることも可能で、会議の議事録をほぼリアルタイムで作成することができるようになるという。1~2年後の実用化を目指す。
341Picks
日本電信電話株式会社(にっぽんでんしんでんわ, にほんでんしんでんわ、英語: Nippon Telegraph and Telephone Corporation、略称: NTT)は、日本の通信事業最大手であるNTTグループの持株会社。持株会社としてグループ会社を統括するほか、グループの企画開発部門の一部を社内に擁し、規模的にも技術的にも世界屈指の研究所を保有する。 ウィキペディア
時価総額
14.8 兆円
業績

新着記事一覧
こんなにいる。抹殺指令「オーダー66」を生き延びたジェダイまとめ【ネタバレあり】
ギズモード・ジャパン 3Picks
小物でゴチャつきがちな車内、このポケットでスマートな見た目になりました
ギズモード・ジャパン 3Picks
目立たずUSBポートを増設! サンワダイレクトのクランプ固定式USBハブ
ギズモード・ジャパン 5Picks
アプリで操縦&トランスフォームするオプティマス・プライム
ギズモード・ジャパン 2Picks
使いこなしてる? Bing AIと融合したMicrosoft Edgeの便利機能9つ
ギズモード・ジャパン 2Picks
BMWが新型「5シリーズ」にEV版、待望の電動モデル「i5」の中身
WIRED.jp 2Picks
アジア発のオリジナル映画で攻勢、Netflixが変えるコンテンツの勢力図
WIRED.jp 3Picks
ドリーミーなボケ写真を作り出す手持ち半円フィルター
ギズモード・ジャパン 3Picks
収納・運搬・ベンチ・テーブルの4役がこなせるアウトドア用収納BOX「4WAY Folding Box」
ギズモード・ジャパン 2Picks
自動運転技術に重大な問題? テスラの内部資料が示唆する「技術的な限界」
WIRED.jp 3Picks
人の話は、アナウンサーの原稿読み上げから日常会話まで、スペクトルが広い。前者に近い場合は、書き起こしはかなりいけるだろうが、後者に近い場合は、実は、その場の文脈や常識を前提にしているところが多く、これを書き起こすのは、門外漢の人間にさえ難しい。まして機械には、当面むりだろう。それでも役立つ場面はいろいろあるが。
録音しているとはいえ、やはりインタビューなり会議では”要点”の書き出しが重要です。そこはインタビュワーの腕の見せ所ですので。
うろ覚えの固有名詞を修正してくれたり、そこもAIがカバーしてくれたらかなり画期的ですね。
これで全文書き起こししてくれ、それを構造化、整理したりするのが人間の役割になるとよいですね
たくさんの人達が集まっているカクテルパーティでも、特定の人の話している内容はしっかり聞こえるというものでしたっけ。
まさに「点と線」
人間は、見たいものしか見えない。
聞きたいことしか聞こえない。
http://jpn.nec.com/voicegraphy/necvsol.html