新着Pick
1290Picks
Pick に失敗しました

人気 Picker
音声文字変換の技術はすごい勢いで進歩してる。英語だとほぼ完璧。日本語でもかなり精度が上がってきた。人類がメモ起こしという苦行から解放されるまであと一歩だ。

この技術が広まれば、例えば動画データの音声を文字データ化して検索可能になったりする。最高。政治家の街頭演説、識者のテレビコメント、どんどんデータが溜まって検証可能になればいい。ディープフェイクには注意が必要だけど、それも技術で対応できるはず。
英語の講演を聞いているときに、サポートとして使ってみたことがありますが、聞くのと読むのとでは使っている脳の領域が違うんですかね。文字を読んでしまうと音声が全然頭に入ってきませんでした。話の理解は捗るのですが、リスニングの訓練にはならない感じ。まだまだ練習が必要と感じました。
単に音声を文字起こししたりというのには、とても便利だと思います。
以前、この文字変換のニュースを見て、どうやって保存すればいいのか疑問を抱きました。

実際に使ってみたけど、保存方法がわかりませんでした。

コピペ機能が付けば最強ですね!
ドンドン音声メモが増えていきそうです(^_^)
興味深く拝読しました。
音をスピーチか環境音かを判断し、環境音は文字変換せず注釈をつけているのですね。すごい!
背景が黒いのも見た目の問題ではなく、ちゃんと意味があるのですね。

【Googleの新アプリが凄すぎる。リアルタイム文字変換の精度がエグい】
https://newspicks.com/news/3802130
多くの人が期待してるのは、インタビュー取材や座談会、セミナーなどを録音した音声データを文字起こししてくれる機能なのではないでしょうか。そういうニーズにストレートに答えてくれるアプリなりソフトを誰か開発してくれないでしょうか。APIはオープンらしいし。
英語であれば、otterが無敵なのですが、Googleは日本語もサポートしているところが、すばらしいですね。

そういった意味では、「多言語対応」というキーワードがでてくると、現時点では「Google」が最強だと思います。

Pixel3で試してみようと思います。

最近、PCでも、キーボードでの入力が面倒になってきたので、いろいろな機器で音声入力が使えるようになればと考えています。
視覚障がい者のためのアクセシビリティ機能が、全ての人のニーズに応える→新たな市場を創るという興味深い流れ。

音声文字変換の技術進化は、デジタルマーケティング領域にも大きな影響が出てくると感じる。
iOS版をお待ちしております。
凄い