日本テレビら、AIによるニュース記事の自動要約の実証実験を実施
コメント
注目のコメント
「要約」は人や内容により無数に正解があるため、定義化(ルール化)しづらい点が自動化に向けた最大の課題だと思います。
例えば例文では、「台風の影響により東京は大雨。交通に影響が出る」という内容に要約していますが、果たして「過去最大の降水量」という内容は要約の要素から落としてよいのかという事。利用用途によっては過去最大という要素はとても大切かもしれない。
特異なキーワードに重み付けをするというアプローチをするようですが、効果は限定的ではと思います。ないよりはまし、なある程度の質の要約文はすぐ自動で作成できるかもしれませんが、万人が納得する要約の自動形成は簡単ではないでしょう。事象の文脈や背景を読み取り要約文章が書ける人間はやはり偉大です(今のところは)ひょっとしてニュースのテキスト原稿を流し込んで要約するだけ?
あるいは、生放送の場でオペレーターさんたちが打ち込む生字幕データを同じく流し込んで要約か?
はたまた、音声認識システムでリアルタイムでテキストデータ化してそのまま要約?
アナウンサーによりしっかりと調教され、専門用語やニュース用語も単語登録された音声認識システムならかなりの変換精度が出ますからね。NHK放送技研は98%ぐらいまでいけると言っていたし。ただし、NHKはその2%が放送事故につながる可能性があるから導入できないとかもったいない笑。
もともとのニュース原稿じたいがかなり簡潔なので、どこまで要約してデータ配信でマネタイズのニーズがあるだろうか?街中のデジタルサイネージ向けがいちばん可能性ありそう。
そのうちニュース原稿そのものをAIが作り、CGのアナウンサーが読み上げるようになるんでしょう。音声読み上げソフトもしっかりとチューニングすればかなりナチュラルな発生とイントネーションで読んでくれるから。どんな感じになるんだろうか見ものですねぇ〜
こんな感じなのは、ドンドンそれで良いと思うけど、何に最適化して記事を作っていくんだろうと思うと、一般的な記事で、よく見かけるものとかにならないのかなあ^_^?
って思ってたら、すでに学習させていたんですねぇ