新着Pick
342Picks
Pick に失敗しました

人気 Picker
マルチモーダルインタラクションの概念が登場してそろそろ30年、ついに機械学習が実用化に近づいた感があります。

音声対話やジェスチャー操作が始まると「楽になる」というのはその通りですが、「誰でも使える」というのは必ずしも真ではありません。フリック入力でも使えるようになるには訓練が必要でした。

音声操作やジェスチャー操作も、訓練して使えるようになるものでしょう。それが2020年代のITリテラシーであり、新たなデジタルデバイドです。

20世紀にキーボードを打てないオジサンを笑っていた現在のミドル世代、今度は我々の番です。(なので、毎日音声入力でチャットやメール書いて練習しています。)
最近、あるところでAIの未来について、相談(?)する機会がありました。日本はまだまだものづくり信仰が根強くてがっかり。言いたいのはハードウェアでは駄目ということではなく、一緒にソフトも考えないといけないのではということ。
事業、技術、文化の広い視点でAIが語られており、そうあるべきだなと思います。

・事業
「われわれは長期的な作業を成し遂げようとしており、8〜10年という旅路のなかで(商用アプリケーションに向けた)有益な成果を捨て去るような進路変更をしばしば加えており(中略)その後、より難しい問題に取り組み続けている」と、正直ベースで語られてます。
まさにその通りで、AI技術の成長への投資と、AI技術が支えるアプリの短期的な成長や売上は必ずしも一致せず、事業運営で意識するトレードオフ。

・技術
視覚・聴覚・触覚などを総合したマルチモーダル学習、精度を落とさず軽量化したモデルなどが、より実用性を高めるための大きな方向性。

・文化
美空ひばりさんのAIに対する賛否のように、音声合成などによる創造性の追求と、倫理的な抑止はセット。軍事転用などの分かりやすい倫理テーマだけでなく、倫理判断が難しい領域にもAIが活用される中、オープンソース化などの実験的な試みを繰り返して、文化が形成されていくのでしょう。
AlphaGoが2016年3月に現れて、AIの認識を根本から変えてしまった。それから4年たつが、一歩一歩確実に人間の理解に近づいているのがわかる。最先端は「意識」の領域に入りつつある。私たちもAIと正面から向き合わなくてはならなくなると思う。
最終的にいつ普及するか、広く普及するかどうかは技術ではなく、法規制の整備にありそうなものが多いですね。利便性と個人情報的なリスクの天秤の話をコンセンサスが取れるのか。

蛯原さんが本で書かれている視点の重要性を改めて思い出す。
Googleの内部で、生み出されるアイデアの視点を学ぶには、よい記事ですね。内部では、この100倍、1000倍のアイデアがあるとは思いますが…

※個人的な見解であり、所属する会社、組織とは全く関係ありません