0.2秒でモノの名前をタグ付けする、ビジュアルタギング技術の可能性

2019/5/14

リンゴを写せば、品種や産地もわかる

未来が本当に近づいていると感じたのは、チューチ(Chooch.ai)のスマートフォンアプリを実際に見せてもらった時である。
チューチはビジュアルタギング技術を開発するスタートアップで、ビデオ画像に写っているモノを識別して、さらにそれが何かを文字でタギングするものだ。企業向けに技術を提供することを目的としている。
同社のスマートフォンアプリでは、カメラを向けるだけであっという間にそこに写っているモノの名前がタギングされて出てくる。タグが表示されるまでの時間が何と0.2秒。ほぼリアルタイムで、カメラとAIがモノを見分けていることがわかる。
すごいと思いつつ、ちょっと怖くならないだろうか。
同社のAIが認識するのは、モノ、顔、文字、食品、形状、風景、ヘアスタイル、スポーツなどなどなど。つまりかなり幅広い対象だ。
しかもチューチの強みは、さらにその下の分類、たとえばブランドとかバリエーションとかといったものも見分けていくことにある。「スニーカー」だけでなく、「白く」て「ナイキ製」で「女性向け」で「今春のモデル」といったような識別ができるのだ。「リンゴ」ならば、どの品種でどこの産地かといったこともわかる。

広告やマーケティング、観光ガイドにも

さて、この技術はどう使えるのか。
ARメガネをかければ、向こうからやってくる人の名前がわかるような、未来のことだと思っていたことが、これで可能になる。顔認識が素早くなることで、企業のエントランスや社内の部屋でアクセスを許可された人物かどうかを見分けるのにも役立つ。
誰かが身につけている服や靴を見分けることもできるので、マーケットリサーチに使えば便利そうだ。
観光ガイドとしても利用できるのではないだろうか。知らない街で、風景にカメラを向けるだけでその場所や名所の名前がわかり、そこからより深い情報にアクセスできるといったシナリオも考えられる。
広告やマーケティングでは、もっと幅広い使い方が出てくるかもしれない。ビデオのストリーミングを提供する際に、そこにブランド名がタギングされれば、広告収入が入るといったような逆方向からの使い道もあるだろう。
チューチは、この技術をパッケージ化して開発企業に提供する。自社でゼロから画像認識のAIを開発したり、訓練したりする必要がなく、自社特有の対象の訓練を加えるだけですぐに使えるようにするというものだ。

画像認識はすでにインターネットのような存在

画像認識技術自体の進歩は目覚ましくて本当に驚くばかりだが、同社の話を聞くと、そのビジネスモデルも多様化しているのがわかる。
チューチの創設者のエムラ・ガルテキン氏によると「画像認識と一言で言っても、もうインターネットと言っているようなもの」とのことで、この分野はすさまじく拡大していると語る。
ただ、現在は自動運転車向けの開発にかなり偏っていることは確かで、だからこそ、そこへ一般的なモノや風景を正確に識別してタギングするような技術開発は勝ち目があるとにらんだらしい。また、この業界はいずれ5〜10社くらいに統合されていくと同氏は予測する。
ところで、こうしたリアルタイムの技術によって、顔認識されたり持っているものを識別されたりする、われわれのプライバシーはどうなるのか。心配ばかりが増える状況だ。
技術開発の当事者からは、とかく「技術はニュートラルなもので、使い方次第」という感じの回答が返ってくることが多いのだが、ガルテキン氏の「いずれルールができて、プライバシー保護の方法が出てくるはず」という答えは、この部分でも認識が変化してきたのかとちょっと期待させるものだった。
感嘆しつつ、こんな技術を逆手に取ったプライバシー保護のための技術の開発も、心底望みたいところだ。
*本連載は毎週火曜日に掲載予定です。
(文:瀧口範子、写真:chooch.ai)