ビッグデータも「質」の時代へ AI学習データ提供する翻訳ベンチャーの勝算
コメント
注目のコメント
「ビッグデータも「質」の時代」
それは昔から言われていた話で、ノイズの混在するデータをクレンジングするするのにデータ処理のほとんどの時間(8-9割)が取られているという統計もあるくらいです。
データ分析をデータサイエンティストの手から解き放て
https://type.jp/et/feature/5581いつの時代もデータの質は大事。
脱線すると、AIが人種差別等の偏った判断をしてはいけないという議論で、AIアルゴリズムの提供会社より、AI学習データの提供会社の方がカギを握っていて、その裏のクラウドワーカー達こそがAIの判断基準を作っている。現在の対話型AIの大きな課題の一つが、複数回のやり取りを行うマルチターンの対話コーパスの不足です。
AIスピーカーなら予約・購買時がもっとも有用でしょう。本命は企業の中で、様々な業務指示や問合せの際の対話例です。この対話データが十分に集まり、汎用化してくれば、業務の自動化が一気に進みます。
その意味でもGengo AIのようなAI学習データを提供する企業には注目しています。