ホーム
628フォロー
746フォロワー
【超速報】OpenAIが最強・最安の「新GPT」を発表した
NewsPicks編集部
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
OpenAIは、DALL•E、ChatGPT、Soraなど、積極的にマルチモーダール化を進めてきましたが、それらは基本的には出力(Output)側のマルチ化が中心で、入力(Input)側はテキスト入力によるものでした。流れとしてOutput→Inputの多様化は予想できるものでしたが、今回発表の「GPT-4o」によってInput側のマルチモーダル化の道が大きく拓けた格好になります。 文字が音声に変わっただけにも思えますが、入力されたテキストを処理する自然言語処理と音声認識は技術分野として全く異なるもので、音声認識→言語変換→内容処理→音声変換→出力と、通常のテキストのみのChatGPT以上の処理を要します。そのため、デモ動画を見る限り、その処理&応答スピードにはかなり驚きます。(どのようなモデルが用いられているのか気になる…) それを可能にしているのが、公式サイトに記載がありますが、end-to-endで一つのニューラルネットで完結している点で、一般的に複数のモデルを組合せてそれぞれのタスクを実行させることに比べての革新性があります。(→"we trained a single new model end-to-end across text, vision, and audio, meaning that all inputs and outputs are processed by the same neural network. ") 別観点ですが、先般iPhoneへのChatGPT統合に向けたAppleとOpenAIとの提携の噂が報じられています。その真偽は現時点では不明ですが、事実となればSiriのアップグレードのためにこのGPT-4oが搭載されることが想像されます。 スマートフォンだけでなく、さまざまなプロダクトへの搭載が想像される技術の幕開けという感じで、今後の展開がますます楽しみです。
2248Picks
OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も
テクノエッジ
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
OpenAIは、DALL•E、ChatGPT、Soraなど、積極的にマルチモーダール化を進めてきましたが、それらは基本的には出力(Output)側のマルチ化が中心で、入力(Input)側はテキスト入力によるものでした。流れとしてOutput→Inputの多様化は予想できるものでしたが、今回発表の「GPT-4o」によってInput側のマルチモーダル化の道が大きく拓けた格好になります。 文字が音声に変わっただけにも思えますが、入力されたテキストを処理する自然言語処理と音声認識は技術分野として全く異なるもので、音声認識→言語変換→内容処理→音声変換→出力と、通常のテキストのみのChatGPT以上の処理を要します。そのため、デモ動画を見る限り、その処理&応答スピードにはかなり驚きます。(どのようなモデルが用いられているのか気になる…) 別観点ですが、先般iPhoneへのChatGPT統合に向けたAppleとOpenAIとの提携の噂が報じられています。その真偽は現時点では不明ですが、事実となればSiriのアップグレードのためにこのGPT-4oが搭載されることが想像されます。 スマートフォンだけでなく、さまざまなプロダクトへの搭載が想像される技術の幕開けという感じで、今後の展開がますます楽しみです。
137Picks
アップル、iPhoneへのChatGPT搭載でオープンAIと合意に近づく
Bloomberg
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
4月終わりに報じられたApple & OpenAIのタッグの噂が現実味を帯びてきたようです。 「ChatGPT機能の統合」とあることから、Siri周りのバージョンアップに関わるものだと想像されますが、まずは合意締結とのことなので、手元でその進化を味わえるようなるには多少の時間がかかるのではないかと思われます。 生成AIとくにLLMの開発を巡っては、Appleは、OpenAI&MicrosoftのChatGPT、GoogleのGemini、MetaのLlama、AnthropicのClaudeなどとの開発競争に明らかに遅れを取っている状況ですし、プロダクト開発では、GoogleのPixcelやSamsunのGalaxyに後塵を拝しています。 ですが、見方によっては後発者利益を狙った戦略と捉えることもできます。実験的に公開されているLLMサービスとは異なり、スマホというコンシューマープロダクトに搭載するためには、より高いサービス品質が求められることに間違いありません。そのため、遅れている自社開発よりも、その時点で最も性能の高い他社技術を取り入れることは有効な戦略の一つだと思います。 とくに強いブランドロイヤリティによって支えられているAppleファンの顧客基盤を思うと、開発競争に遅れることよりも、実験的な低品質なサービス実装で失望させられることの方が離反ダメージが大きいはずです。実際、Appleのこれまでを振り返っても、矢継ぎ早に新機能を搭載することよりも、確かな品質を追及することを優先してきたように思います。 生成AIを巡る競争は、確実にプロダクト搭載・サービス搭載のフェーズに移ってきています。アルゴリズム開発とは異なる戦場になりますし、やはり技術はユーザーに使われて"なんぼ"と思うと、Appleの巻き返しは充分考えられるのではないでしょうか。
446Picks
入山教授が語る、日本企業に必要な“イノベーションマインド”──AI時代に人間が「知の探索」を担うには
Biz/Zine
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
既存業務の効率化に代表される「知の深化」はAI・デジタルに任せ、新たな事業アイデアを創出するような「知の探索」は人が担うべきという、入山先生のご意見には大きく賛同します。 とくに機械学習というAI技術は原理的に、既存にある情報やアイデア、やり方をデータとして参照した上で、それらを人間を超える処理スピードで組合せ、まとめ、答えを算出することを得意とする一方、我々人間にとって新規性のあるアイデアを生み出すことはやはり不得意とする傾向があります。 そうした新たなアイデアを探索し、イノベーションとして形作る方向にいかに人的リソースを割く余力を生み出せるかが、非常に重要なフェーズにあるのだと思います。 そのためには先生の仰るように、失敗を通した試行錯誤からアイデアを見つけ出すことを奨励する企業文化が必要で、もっと言えば"失敗"という捉え方すらも捨てることがとても重要なのではないかと感じます。 企業や人材を定量的な成果のみで判断するのでなく、プロセスで評価することがとても大切なのだと思います。 こう考えると、まさに「経路依存性」としての多くのトラップが今の企業内に複雑に絡んでしまっている実態を思い知らされます。
2Picks
米オープンAI、13日に検索機能発表 グーグルに対抗=関係筋
Reuters
NORMAL