わずか9ヵ月でOpenAIに匹敵するAIモデルを開発したフランス「Mistral AI」とは
2023年5月にフランスで設立されたAIスタートアップ、Mistral AI(ミストラルAI)がOpenAIを猛追しています。
同社はわずか9ヵ月でOpenAIの大規模言語モデル「GPT-4」に匹敵する「Mistral Large」を発表しました。
さらに、マイクロソフトとの複数年にわたる戦略的パートナーシップを発表して、より一層開発を加速させていくことが明らかに。
改めて、このMistral AIとはどんな会社なのかをおさえていきましょう。
サムネイル画像:Mistral AI
☕️coffee break
ミストラルAIの創業者は、Google DeepMind出身のArthur Mensch(アーサー・メンシュ)氏、Meta出身のTimothée Lacroix(ティモテ・ラクロワ)氏とGuillaume Lample(ギョーム・ランプル)氏の3名。
全員が30代前半で、学生時代から同じAI分野の研究者として交友関係があったことから、2023年5月に設立されました。
(CEOのアーサー・メンシュ氏は2017年に京都のNTTコミュニケーション科学基礎研究所で客員研究員を務めていたことも)
ミストラルAIが一躍世界から注目を集めたのは、2023年6月のこと。
設立からわずか1ヵ月後のプロダクトがない状態で、わずか7ページのメモによりなんと1億1300万ドル(当時約159億円)もの資金が集まったのです。
リード投資家は世界に7拠点を構える著名VCのLightspeed Venture Partners、その他にもイギリス、フランス、ドイツ、イタリア、ベルギーなど、欧州各国で有名な投資家が出資しました。
しかも調達後評価額は2億6000万ドルであるため、シードラウンドで約43%もの株式を放出した異例のエクイティファイナンスだったんです。
米国・インド・欧州で大規模言語モデル(LLM)を構築しようとしているスタートアップは数多く見てきましたが、多くはLLMを構築してからの応用について考えられていませんでした。
LLM・最適化に関する専門知識を持つのは世界でも70〜100人ほど。ミストラルAIにはそこに名前が挙がるほどトップレベルのメンバーが集まっている上、オープンソースでの戦略的な事業展開を掲げていたため、その挑戦を見逃すことはできませんでした。
そして、半年後の12月にはシリーズAラウンドの資金調達を行いました。
このとき、再び驚きなのが、なんと評価額20億ドルで米Andreesen Horowitzをリード投資家に、4億1500万ドル(当時約593億円)を調達したのです。
この背景には2つの言語モデルのリリースが関係しています。
まずは9月に最初の言語モデル「Mistral-7B」をリリースしています。
「Mistral-7B」は73億パラメータの小規模なモデルにも関わらず、Metaが2023年7月に公開した130億パラメータのLlama 2を全ての指標で上回る高性能なモデルだったことから、投資家からの高い評価につながりました。
*パラメータとは:AIモデルがデータから学習する際に、正確な結果を出せるようになるために調整可能な変数のこと
また、シリーズAの資金調達発表と同時に、モデルの一部を8倍に拡張したパラメータ数467億の大規模言語モデル「 Mixtral 8x7B 」も発表しています。
このモデルはMetaのLLM「Llama 2」や、OpenAIの「GPT3.5」とほとんどの指標で同等、もしくは上回るほどの高いレベルだったのです。
これもシリーズAの投資家は事前に知っていたことから、評価額20億ドルもの高い評価に繋がったと考えられます。
🍪もっとくわしく
さらに開発を加速させるべく、マイクロソフトと3つの中核分野でパートナーシップを締結しました。
- スーパーコンピューティング(スパコン):ミストラルAIのAIモデルのパフォーマンス向上のためにマイクロソフトがAIスパコンを提供
- 市場展開:ミストラルAIがマイクロソフトの顧客にAIモデルの宣伝、販売、提供ができる機会を提供
- AI研究開発:ヨーロッパの公共部門など、特定の顧客向けのAIモデルのトレーニングにおける連携
マイクロソフト側には大きく2つの魅力があります。
①データ管理とプライバシー規制に厳しいEU進出への足がかり
EUでは2018年からGDPR(個人情報をめぐる一般データ保護規則)が施行されている上、独自のAI法導入など、データ・プライバシーをめぐっての規制が厳しくなっています。
ミストラルAIではそれらへの対応に加え、英語、フランス語、スペイン語、ドイツ語、イタリア語を母国語レベルで理解したAIモデルを開発しています。マイクロソフトにとってはEUでの事業展開を拡大していく上での足がかりとしての狙いが考えられます。
②オープンソースのAIモデルの提供が可能に
ミストラルAIの最新言語モデル「Mistral Large」は、大規模なマルチタスク言語理解の指標でOpenAIの「GPT-4」に次ぐ性能を実現しました。
このうち、オープンソースモデルなのは、Metaの「LLama 2」のみです。
一般的に展開されているクローズドソースのモデルでは、ソースコードが非公開であるため、改良をすることができず、セキュリティやプライバシー問題への懸念があります。
一方、オープンソースだと、基本的には無料で利用することができ、開発者が自由にソースコードを改良したり、商用利用することもできます。
それにより、AIをより細かく制御したいと考えている企業や、リスクを恐れて活用できていない潜在的顧客にもアプローチできるようになるのです。
🍫ちなみに
OpenAIが昨年LLM「GPT-4」をリリースした際に、モデルのトレーニングには5000万ドル〜1億ドルをはるかに上回るコストがかかることを明かしていました。
一方、ミストラルAIの「Mistral Large」は、コストを2200万ドル未満(約33億円)にまで抑えながら、「GPT-4」級の性能を実現したのです。
それほど高い技術力を有するミストラルAIと、マイクロソフトがタッグを組んだことで、欧州議会からは独占禁止法の調査を行うべき、といった声も出始めているほど注目を集めているんです。
『Coffee Break with Startups』では平日ほぼ毎日、海外スタートアップの情報を中心に記事を公開しています。ぜひ以下のURLからフォローしていただけるとうれしいです。
更新の通知を受け取りましょう
投稿したコメント