2023/3/30

【Microsoft×OpenAI】生成AIは、なにを革新したのか

NewsPicks Brand Design / Senior Editor
 ユーザーが自然言語で入力したフレーズから画像を生成する「DALL・E2」、対話型のチャットボット「ChatGPT」。2022年にリリースされたふたつのプロダクトは、これからのAIと人とのコミュニケーションがどう変わっていくかを予見させた。

 2019年に戦略的パートナーシップを結び、Microsoft AzureとGPT-3シリーズの連携を進めてきたマイクロソフトとOpenAI。そのビジネス領域への実装が、プラットフォームやツールへの統合と、スタートアップやSaaSベンダーへの支援プログラムによって加速していく。

 その全体像を、日本マイクロソフトでAIのマーケティングをリードする小田健太郎氏、スタートアップとの事業開発を担当する金光大樹氏が語る。
INDEX
  • 生成AIはなぜバズったのか?
  • 自然言語は「究極のインターフェース」
  • OpenAIとマイクロソフト、協業の狙いとは
  • スタートアップのビジネスはどう変わる?
  • 15万ドルのツールを無償提供する理由

生成AIはなぜバズったのか?

──DALL・E2やChatGPTが一般ユーザーに公開されたことで、昨年は生成AIを体験した人が爆発的に増えました。
小田 ネット上や地上波で大きく取り上げられたこともあり、すごい盛り上がりでしたよね。私はマイクロソフトでAIビジネスを長く担当していますが、両親からテクノロジーについて質問されたのは今回が初めてでした。
 ChatGPTの発表に加えてインパクトがあったのは、独自のテクノロジー「Prometheus」によって、当社の検索エンジンBingがAIのパワーを活用できるようになったこと。
 公表されているだけで全世界で100万人以上、日本からも10万人以上が、新しいBingのウェイティングリストに入っています。
 Prometheusは、ChatGPTのベースモデルをさらに検索に特化させ、Bingが持つ関連性や鮮度の高いweb情報を利用しており、次世代モデル「GPT-4」も活用しています。
 日本のユーザーは質問を工夫してAIにキャラクターを付与するなど、ほかの国と比べてもユニークな使い方をされていて、1ユーザーあたりの検索クエリ数は世界一。アクティブユーザーも多く、チャット質問数は200万を超えています。
GPT-4を使った検索エンジン「Bing」は、ユーザーの問いかけに対してインターネット上の出典を示したうえで回答する。
 ビジネスサイドでもたくさんのお客さまから問い合わせを受けますが、スタートアップから中小企業、エンタープライズ、教育機関、政府機関まで、セグメントの縛りがありません。
「ChatGPTって何なのか」「Azure OpenAI Serviceで何ができるのか」と、かつてないほど広い範囲から関心が寄せられています。

自然言語は「究極のインターフェース」

──なぜ生成AIはあれほど急激に広まったのでしょうか。
小田 この数年のもっとも大きな進歩は、「AIが人間に歩み寄ってきたこと」だと思います。
 2010年代にディープラーニングが盛り上がり、さまざまなAIサービスが登場しました。それ以降もいくつものイノベーションがありましたが、なかなか基礎研究やR&Dの域を出ず、世の中を変えるような変化には至らなかった。
 GPT-3など、従来とは比べものにならないほど超巨大規模のデータを学習した言語モデルが登場し、ようやくブレイクスルーが起こりました。
 明らかに生成AIの精度が上がったのは、やはり2021年あたりからです。
 まず画像生成のMidjourneyやStable Diffusion、DALL・E2が次々と公開され、多くの一般ユーザーが遊び始めました。
OpenAIのDALL・E2が生成した「生成AIによるビジネス変革」のビジュアルイメージ。上から、サイバーパンク、アートワーク、ポップアート風と指定した。
 ただ、SNSでの拡散もあり、BtoC領域では一気に広がりを見せましたが、画像生成だけではビジネスユーザーの利活用シナリオが見えにくかった。
 その点、ChatGPTは自然言語のコミュニケーションによって、さまざまなビジネス課題、組織課題を解決するイメージを与えました。
──企業はどこに可能性を見出したのでしょうか。
小田 これまでビジネス領域で大規模なAIの実装が進まなかった理由は、ふたつあります。
 ひとつは、「AIの精度」の問題です。AIを学習させるコンピュートリソースや計算資源、学習に使う絶対的なデータ量が足りておらず、現在ほどのパラメータ数を備えた大規模言語モデルもなかった。
 それまでのチャットボットAIは、あらかじめ用意した質問と回答がペアになったナレッジベースから、質問に応じて近似値を返すような仕組みで動いていました。
 もうひとつは「人」です。AIディベロッパーやデータサイエンティストなどのAI実装や開発スキルを持つ人材が不足していて、自社のビジネスにチューニングできる企業がごく一部に限られていたのです。
 これまではPythonやC++などのプログラミング言語が書けないと、AI開発や機械学習はできませんでした。でも、ChatGPTによって、人が日常的に使っている言葉でAIとコミュニケーションできるようになった。そうすると、AIを扱える人材の裾野も格段に広がります。
 つまり、AIがそれまでとは桁違いの量のテキストデータを学習し、「自然言語」という究極のインターフェースを獲得したことで、「精度」と「人材不足」の両方の課題を同時にクリアした。これが、2022年に起こった変化の本質です。

OpenAIとマイクロソフト、協業の狙いとは

──マイクロソフトは、2019年にOpenAIとの戦略的パートナーシップを結んでいます。協業によって何が変わったんですか。
小田 当社CTOのケビン・スコットがCEOのサティア・ナディラとOpenAIのサム・アルトマンCEOを引き合わせたのが2018年の夏。その翌年には両社のパートナーシップを発表しています。
 パートナーシップの目的は、マイクロソフトからの複数年にわたる大規模投資をもとに、大規模言語モデルやアルゴリズムを共同で研究していくこと。もうひとつは、共同研究から生まれる次世代AIモデルのライセンスを、マイクロソフトが保有し、自社のプラットフォームに活かしていくことです。
 とくに、OpenAIの学習基盤システムや推論を行うGPUリソースとしてMicrosoft Azureを提供したことは、OpenAIが研究開発を加速させるうえでも、エンタープライズビジネスでの活用の道筋を付けるうえでも、双方にインパクトがあったと思います。
 大規模言語モデルの推論には、従来と比べものにならないほどのコンピューターリソースが必要です。ChatGPTに使われているGPT-3.5やGPT-4などの新しいモデルも、Azure上で大規模な演算・学習を行い、構築されています。
 OpenAIのモデルがマイクロソフト製品に実装されたのは、2021年。ローコードのビジネスアプリを生成する「Power Apps」が最初でした。
 その後、CEOのサティア・ナデラはすべての「マイクロソフト製品のあらゆる製品に、製品を一変させるようなAI機能を搭載していく」と述べています。
 2023年に入ってその動きはさらに加速しており、ChatGPTやGPT-4のモデルを自社製品に組み込むことが可能なAzure OpenAI Serviceの発表を皮切りに、検索エンジンのBing、ブラウザのEdge、各種ビジネスアプリケーションやローコードツールまで、既にマイクロソフト製品にはより深くOpenAIの次世代モデルが統合されています。

スタートアップのビジネスはどう変わる?

──金光さんは、マイクロソフトのクラウド開発事業部でスタートアップ向けの支援を行っています。この数年でAIの活用に変化はありましたか。
金光 2019年、マイクロソフトとOpenAIが独占的なライセンス保有にかかるコミットを結んだ時期に、スタートアップ界隈でもGPT-3などの言語モデルに触れる人が増えた印象があります。
 とくにデジタルネイティブのスタートアップでは、Azure OpenAI Serviceが出る前からOpenAIのAPIを実装し始めたところもありました。
 GPT-3シリーズやChatGPTのモデルを使うには、OpenAI社が公開しているAPIを直接使う方法と、マイクロソフト製品に組み込まれたAPIを使う二通りの方法があります。
 従来から自然言語処理やチャットボットを活用した事業を行っているスタートアップは、圧倒的にインテグレーションが早い。スピード感が問われるので、どうやって自社の顧客に使ってもらえるかを実際に開発して試しながら考えます。
 AIをうまく活用している企業ほど、テクノロジーを目的としてではなく、業務領域・産業領域の課題を解決するための手段として捉えています。
 それを本プロダクトに統合して大々的にリリースするとも限らないので、我々もまずはOpenAIのAPIを触っていただいて、本格的に展開するときにAzureを使ってもらえればいいと考えています。
小田 企業が自社のビジネスにAIを活用するとき、とくにChatGPTのようなものを実装し、活用すればするほど出てくる共通のニーズがあります。
 ひとつは「自社のプロダクトやプロセスに最適化させたい」というニーズです。自社の使いみちに合わせて関連するデータを学習させ、ファインチューニングを行い、さまざまなツールと統合してプロセスや使い勝手をよくしたい。
 こうした需要に対しては、各業種別やインダストリー向けのアプリケーションやツールを備えたAzure OpenAI Serviceや、OpenAIモデルを実装済みの製品が適しています。
 それに加えて、エンタープライズ企業ではセキュリティやガバナンス、ネットワークの安定性などが保証されていないと導入しにくい。
 細かいところでは、請求書の発行で決済処理を行いたいなど決済環境などもネックになりますし、学習させるデータのガードレールや権利関係、倫理的なイシューもクリアにしないといけません。
 そういった点にも、パートナーシップの意味がある。マイクロソフトとOpenAIが補い合うことで、より早く新しいAIを実装していけると考えています。

15万ドルのツールを無償提供する理由

──マイクロソフトとしては、新しいAIのビジネス活用をどう支援しますか。
金光 私自身が究極的に目指しているのは、スタートアップがトップラインを伸ばし、成長することです。
 それをサポートするために、Azure OpenAI Serviceを含めたコンピューターリソースの提供からエンタープライズ企業への販売支援まで、あらゆることをやります。
 おもな取り組みには、「Microsoft for Startups Founders Hub」というグローバルで展開しているシリーズD未満のスタートアップ向け支援プログラムがあります。
 これは、Azureなどのサービスを4年間で最大15万ドル、日本円にして2000万円相当分まで無償で提供するものです。
 Microsoft Cloudの機能のほか、Microsoft 365やGitHub Enterprise、Power Platformなどのマイクロソフト製品群が使えるほか、専属エンジニアによるメンタリングや、共同プロモーションなどの支援が受けられます。
 自社製品以外にも、OpenAIのようなパートナー企業のサービスが1000ドルまで無償で使えます。ほかにもオンラインホワイトボードのMiroやノーコードツールのBubble、決済のStripe、LinkedInなど、プロダクト開発や組織運営、顧客開拓まで、スタートアップ経営に必要なツールが一通り揃っています。
 また、我々のパートナーであるSaaS・パッケージソフトウェアベンダー(ISV)向けの支援プログラムも用意しています。
 このプログラムは従来のマイクロソフトのパートナー支援プログラムよりも大幅に参加要件が緩和されており、幅広いパートナー企業に利用していただけることが特徴です。
──おもなビジネスツールが一通り揃いますね。マイクロソフトのプラットフォームの広さを感じました。
金光 急速な成長を目指すスタートアップはとくに、時間、人、資金などあらゆるリソースが足りていないという声をよく聞きます。その限られたリソースのなかで、より多くのことを達成するために、AIなどのテクノロジーをうまく活用してほしいと思っています。
 たとえば、2021年にマイクロソフトとOpenAIが協力して、GitHub Copilotというツールを開発しました。これは、OpenAIのモデルを使って開発時に示唆を与えてくれるようなプログラミング支援ツールで、開発したOpenAI自体が他のプロダクトの開発にも活用しています。
 そうやって開発された新しい技術が、またGitHubに実装され、ユーザビリティや性能が加速度的に上がっていく。私はこういう循環をもっと増やしていきたいんですよね。
小田 「Copilot(副操縦士)」は、我々にとって重要なキーワードです。操縦するのはあくまで人であり、AIは副操縦士としてサポートする。
 今はプログラミングスキルがない人も、AIに何をしたいかを言葉で明示すれば、コードを書いて実装までやってくれる。デザインスキルがない人も、こんなサイトをつくりたいと伝えれば、AIがすぐにつくってくれる。こういう世界が、近い将来に実現します。
 これはAIとタスクや作業を分担し、人が本来注力すべきことに集中するためのイノベーションです。
 一人でも多くの人に、この新しいAIに触れてもらいたいと願っています。