NASAが採用のビッグデータ処理ツールLabelboxが評価額10億ドル突破
コメント
選択しているユーザー
機械学習には、大量の高品質なデータが必要です
昨年AI開発で権威あるアンドリュー・ンさんが、DataCentricという概念を強く推し出しています
これは、あるアルゴリズムを改善するタスクにおいて、アルゴリズムの改善を行うより、データの改善を行った方が精度を上げられたという概念です
そのため、良質なデータをいかに集められるがAI開発の成功を左右すると言えます
アノテーション作業は日本人でないとできない自然言語のタスクなどもあり、1億総活躍出来る分野でもあります
弊社もWeb/スマホアプリのアノテーションツールを提供していますので、是非実際に作業をしてみて、「AIにはこういうデータが必要なのか」と理解を深めてみるといいかもしれません
https://harbest.site
注目のコメント
「機械学習において重要な役割を果たすのが、アルゴリズムにデータを学習させる際に、個別のデータにタグやラベルづけを行うアノテーションというプロセスだ。」
機械学習は専門外だが、個別のデータのタグやラベルのつけ方が優秀で、アノテーションの後の機械学習のプロセスや全体的な結果に対して何か良い影響を与えるということだろうか。
NASAの事例で具体的にどういう風に使われているのかも気になる。「ラベルボックスを使って地球上の微生物の動きを捉えた動画をAIに学習させ、宇宙空間で生命の兆候をさぐるプロジェクトに活用」とのことだが、たとえば火星で撮影されたミミズの化石のような写真を見て、それが本当に生物の痕跡なのか偶然の産物なのかが判別できる、みたいな感じか?これはAI時代ではのサービスですね。
機械学習においてラベリングはネックで、とても時間がかかるだけの誰でもできる作業。有能な研究者が時間を溶かすのは勿体なさすぎる
その内(というかこれも?)「AIの学習のためのAIによるラベリング」になり、人間がループに入らない様になりそう