Humane - AI時代のコンピューターのカタチとは

2023年3月12日
全体に公開

こんにちは。今週のシリコンバレーは、Silicon Valley Bank(SVB)の破綻の話題で持ちきりです。40年間にわたってシリコンバレーで、地元のスタートアップなどのメインバンクとして機能してきた資産規模で全米16位の地方銀行が、突然破綻しました。預金の引き出しが停止され、このままだとシリコンバレーの企業らの給与や取引先への支払いにも影響が出るかもしれません。

破綻の背景などの解説はもちろん他の有識者に譲りますが、シリコンバレー、ひいては米国経済の先行きへの不安が銀行の信用不安を招きました。リーマンショックのようなシステミックな信用不安への引き金にはならないとも言われていますが、ますます何が起こるかわからない時代になってきました。シリコンバレー、ひいてはIT産業に何が起こっているのでしょうか。

スマートフォンの隆盛の終わり

本トピックでも何度か書いてきましたが、この15年間ほどのシリコンバレー、IT産業の隆盛は二つの要因に牽引されてきました。一つにはリーマン・ショック以降の世界的な金融緩和によるマネーの供給。その行き先が、2007年のiPhone登場以降のスマートフォンの普及によるアプリやサービスでした。

調査会社のIDCによると、2022年のスマートフォンの出荷は大幅に落ち込んだようです。特にホリデーシーズンを含みiPhoneが発売される第四四半期が、第三四半期と比べても落ち込んだことは衝撃的です。

スマートフォンはここまで21世紀の世界に最大の影響を与えたプロダクトです。しかし製品としての進化はここ数年は漸進的で、毎年買い替えるような必要はなくなっています。各種の調査によれば世界人口の半分、40億人以上がスマートフォンを持っていると言われており、これ以上の急成長を望むのは無理があるというものです。

AIの時代の到来 - 新しい酒には新しい皮袋を

ここ数年間のシリコンバレー/IT産業は、スマートフォンの後の成長領域を模索してきたと言えるでしょう。Web3やメタバースなどがその候補として上がってきました。しかし仮想通貨のバブル崩壊や、VRヘッドセットなどへの関心の低さを受けて、いずれも失速しています。そうした中で、ChatGPTのブームが起こり、生成AIが大きなトレンドとして浮上してきました。

ハイプだけが先行したものの実際にユーザーに使われる製品が出てこなかったWeb3やメタバースと異なり、ChatGPTは3ヶ月で1億人が使い、Bingのチャット機能もすでに4500万人が使っているとのことです。この実際の利用者からの支持が、AIが価値を提供できていることの何よりの証拠です。

現在生成AIのソフトウェアは、PCやスマートフォンで実行されています。しかし、これらのコンピューターは、2010年代以降のモダンなAIソフトウェア以前に設計されたものです。

現代のパーソナルコンピューターの設計を決定づけたアラン・ケイはかつてこんな言葉を残しました:

あなたがソフトウェアに本当に真剣であるのならば、独自のハードウェアを作る必要がある。
アラン・ケイ

例えば、ウェブはパーソナルコンピューター上で登場して普及しました。その後、ウェブサービスを前提としたコンピューターの形として、常時インターネットに接続されていることを前提にサービスやコンテンツの利用に最適化された、スマートフォンやタブレットなどのスマートデバイスが登場しました。

このように考えると、AIの技術がこれだけ進化した中で、それを前提に設計されたわけではないスマートフォンは、AI技術を活用する上で最適な設計にはなっていません。すると必然的に、AIに最適化されたパーソナルコンピューターとはどのようなものか、という発想が出てきます。

Humane - iPhoneとMacのDNAを受け継ぐスタートアップ

SVBの破綻と並んで今週ニュースになったのが、Humaneというステルススタートアップによる1億ドルの調達です。投資家にMicrosoft、LGのCVC、QualcommのCVC、そしてOpenAI CEOのSam Altmanらも名を連ねています。

あまり知られていないスタートアップかもしれませんが、2018年に創業され創業者はAppleでMacOS XやiOSのUIデザインに関わったImran Chaudhri氏と、同じくiOSやmacOSの開発ディレクターを務めていたBethany Bongiorno氏。他にも、SafariやiOSのキーボードなどを開発し、その内幕を記した「Creative Selection」という著書のあるKen Cocienda氏など、元Appleのスタッフが多く在籍しています。

Humane website

事業の詳細はいまだに公表されておらず、「AI時代のデバイスとサービスのプラットフォーム」を作っているとされています。今回の調達と同時にOpenAIおよびMicrosoftとの提携も発表しました。最初の製品を今春のうちに公開するとしています。

謎に包まれたHumaneの製品ですが、いくつかのヒントがあります。

まず、2021年の投資家向けのプレゼンスライドとされる画像によれば、ライフログ用に用いられるようなウェアラブルカメラについて記されています。

また2022年に9to5googleが報じたところによれば、同社はレーザープロジェクターを用いて、手や目の前の自動車のエンジンやテーブルなどに情報をプロジェクションするUIの特許を出願しています。手によるジェスチャー操作も含まれています。

https://patentimages.storage.googleapis.com/62/ef/9d/14172adc558884/WO2020257506A1.pdf

こちらが、特許の情報をもとに第三者が制作したイメージ動画です。

これらの情報を見て、元々HCIの研究者をしていた筆者は、即座にMIT Media Labによる2010年代の研究「SixthSense」を思い起こしました。特許を見る限り、Humaineの製品はかなりこのアイデアに近いのではないかと思われます。当然ながら、イヤホンマイクを組み合わせて音声も用いるでしょう。

Assistant Intelligent Deviceはスマートフォンを置き換える夢を見るか

ARデバイスというと、長らくスマートグラスが注目されてきました。しかし、視野角や明るさ、バッテリー重量など、技術的には多くの困難があり、短期的には解消される見込みがありません。

カメラと組み合わせたモバイルプロジェクターにはいくつかのメリットがあります。グラスと異なり、上記のような視覚表現の乏しさが解消されます。顔につけないことで、ある程度サイズや重量を大きくすることもでき、バッテリーの問題も解消しやすいです。目の近くの画面をずっと見続けることは眼精疲労を招きます。プロジェクターであればそのような問題もありません。ARグラスの一つの社会的な大きな問題は、利用者が見ている情報が周囲の他の人にはわからないことです。筆者は実は博士論文でこの問題を研究しました。プロジェクターであれば、そのような問題も起こりません。

カメラやマイクは、記録にも利用できるのでしょうが、どちらかというとユーザーの置かれている状況や、目の前の物をAIが認識するために利用できます。そして、その状況に応じて、AIが情報を表示し、ジェスチャーやChatGPT的な自然言語の対話で操作できる。こんなコンピューターができたら、確かにスマートフォンの小さな画面を置き換えることができる可能性があります。

筆者が2016年に2030年の世界を描いた「人工知能は私たちを滅ぼすのか」では、スマートフォンを置き換えるAI時代のデバイス「Assistant Intelligent Device(A.I.D)」を登場させました。それは身につけることのできるロボットで、音声を用いた言語による入出力と、カメラとプロジェクターを用いたホログラムによる情報表示を可能とするデバイスでした。Humaneの特許の内容となんだかよく似ています。

A.I.Dのピート

スマートフォンは、マルチタッチという自然なジェスチャーによる操作を実現しました。それでも、人間が集中して操作しなければならないことには変わりなく、結果的に今ここで起こっていることから人間を切り離してしまうという問題がありました。

AIがカメラやマイクを通して環境のコンテクストを認識し、ジェスチャーや音声言語による人間の入力を認識し、音声やホログラムで情報を提示するようなA.I.Dが、スマートフォンの次のデバイスになるのでしょうか。

応援ありがとうございます!
いいねして著者を応援してみませんか



このトピックスについて
岩田 雄一朗さん、他829人がフォローしています