【必見】LINEの「文字起こし」ツールの精度がすごい
- 必死に「メモ取り」しなくていい
- 音が「一発」でテキストに
- 穴埋め問題で「自主トレ」
- 「コウシン」をどう変換する?
- 「文字起こし」の未来
プレミアム会員限定の記事です
今すぐ無料トライアルで続きを読もう。
オリジナル記事 7,500本以上が読み放題
オリジナル動画 350本以上が見放題
The Wall Street Journal 日本版が読み放題
JobPicks すべての職業経験談が読み放題
自分もライターという職業柄、一月に10本前後のインタビューデータの文字起こしが発生します。
以前、AI文字起こしを試してみましたが、精度が悪くて使い物になりませんでした。ところが数ヶ月前、あるAI文字起こしアプリの精度がすごく高いことに気づき、有料ではありますが今ではすべての起こしをそのアプリで対応しています。録音状況がよければ、起こし間違いは5%くらいに収まるイメージです。
他のライターさんたちも、AI文字起こしの精度がここ数ヶ月で飛躍的に上がったと言っていたので、何か技術的進歩があったのだろうと思っていましたが、背景にはこういう技術があったのですね。
LINEの「CLOVA Note」も、試してみます〜
AIはアルゴリズムと同様に大量の学習データが肝だと思いますが、Wikipediaとかを使うただのテキストと違って、「音声データとその書き起こし」が同時に並ぶ学習データってネットに転がっているわけではないですよね。それを痛感しました。そして、人海戦術。
英語の文字起こしは進んでいるというお話もありましたが、英語の学会では「Otter」というのを使っていました。
https://otter.ai/
めちゃくちゃ精度もよく、(ぼくはまだ使ったことはないですが)zoomなどのオンラインでも使いやすいようになっているみたいです。ずっと文字起こしさせておくとリスニング苦手な人にとっては少し気が楽になる気もしますよね!
情報系の学生です。
自然言語処理系の授業がありますが、End-to-Endモデルは非常に画期的な技術だと思います。
今まではそれぞれの処理を別々のモデルでやらなくてはならないですが、これを使うと一貫したモデルで処理できます。
NewsPicksの記事も対談形式が多いので、CLOVA Noteで作成した記事などがでてきても面白いかなと思います。
マイニュースに代わり
フォローを今後利用しますか