ホーム
628フォロー
746フォロワー
【超速報】OpenAIが最強・最安の「新GPT」を発表した
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
OpenAIは、DALL•E、ChatGPT、Soraなど、積極的にマルチモーダール化を進めてきましたが、それらは基本的には出力(Output)側のマルチ化が中心で、入力(Input)側はテキスト入力によるものでした。流れとしてOutput→Inputの多様化は予想できるものでしたが、今回発表の「GPT-4o」によってInput側のマルチモーダル化の道が大きく拓けた格好になります。
文字が音声に変わっただけにも思えますが、入力されたテキストを処理する自然言語処理と音声認識は技術分野として全く異なるもので、音声認識→言語変換→内容処理→音声変換→出力と、通常のテキストのみのChatGPT以上の処理を要します。そのため、デモ動画を見る限り、その処理&応答スピードにはかなり驚きます。(どのようなモデルが用いられているのか気になる…)
それを可能にしているのが、公式サイトに記載がありますが、end-to-endで一つのニューラルネットで完結している点で、一般的に複数のモデルを組合せてそれぞれのタスクを実行させることに比べての革新性があります。(→"we trained a single new model end-to-end across text, vision, and audio, meaning that all inputs and outputs are processed by the same neural network. ")
別観点ですが、先般iPhoneへのChatGPT統合に向けたAppleとOpenAIとの提携の噂が報じられています。その真偽は現時点では不明ですが、事実となればSiriのアップグレードのためにこのGPT-4oが搭載されることが想像されます。
スマートフォンだけでなく、さまざまなプロダクトへの搭載が想像される技術の幕開けという感じで、今後の展開がますます楽しみです。
OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
OpenAIは、DALL•E、ChatGPT、Soraなど、積極的にマルチモーダール化を進めてきましたが、それらは基本的には出力(Output)側のマルチ化が中心で、入力(Input)側はテキスト入力によるものでした。流れとしてOutput→Inputの多様化は予想できるものでしたが、今回発表の「GPT-4o」によってInput側のマルチモーダル化の道が大きく拓けた格好になります。
文字が音声に変わっただけにも思えますが、入力されたテキストを処理する自然言語処理と音声認識は技術分野として全く異なるもので、音声認識→言語変換→内容処理→音声変換→出力と、通常のテキストのみのChatGPT以上の処理を要します。そのため、デモ動画を見る限り、その処理&応答スピードにはかなり驚きます。(どのようなモデルが用いられているのか気になる…)
別観点ですが、先般iPhoneへのChatGPT統合に向けたAppleとOpenAIとの提携の噂が報じられています。その真偽は現時点では不明ですが、事実となればSiriのアップグレードのためにこのGPT-4oが搭載されることが想像されます。
スマートフォンだけでなく、さまざまなプロダクトへの搭載が想像される技術の幕開けという感じで、今後の展開がますます楽しみです。
アップル、iPhoneへのChatGPT搭載でオープンAIと合意に近づく
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
4月終わりに報じられたApple & OpenAIのタッグの噂が現実味を帯びてきたようです。
「ChatGPT機能の統合」とあることから、Siri周りのバージョンアップに関わるものだと想像されますが、まずは合意締結とのことなので、手元でその進化を味わえるようなるには多少の時間がかかるのではないかと思われます。
生成AIとくにLLMの開発を巡っては、Appleは、OpenAI&MicrosoftのChatGPT、GoogleのGemini、MetaのLlama、AnthropicのClaudeなどとの開発競争に明らかに遅れを取っている状況ですし、プロダクト開発では、GoogleのPixcelやSamsunのGalaxyに後塵を拝しています。
ですが、見方によっては後発者利益を狙った戦略と捉えることもできます。実験的に公開されているLLMサービスとは異なり、スマホというコンシューマープロダクトに搭載するためには、より高いサービス品質が求められることに間違いありません。そのため、遅れている自社開発よりも、その時点で最も性能の高い他社技術を取り入れることは有効な戦略の一つだと思います。
とくに強いブランドロイヤリティによって支えられているAppleファンの顧客基盤を思うと、開発競争に遅れることよりも、実験的な低品質なサービス実装で失望させられることの方が離反ダメージが大きいはずです。実際、Appleのこれまでを振り返っても、矢継ぎ早に新機能を搭載することよりも、確かな品質を追及することを優先してきたように思います。
生成AIを巡る競争は、確実にプロダクト搭載・サービス搭載のフェーズに移ってきています。アルゴリズム開発とは異なる戦場になりますし、やはり技術はユーザーに使われて"なんぼ"と思うと、Appleの巻き返しは充分考えられるのではないでしょうか。
入山教授が語る、日本企業に必要な“イノベーションマインド”──AI時代に人間が「知の探索」を担うには
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
既存業務の効率化に代表される「知の深化」はAI・デジタルに任せ、新たな事業アイデアを創出するような「知の探索」は人が担うべきという、入山先生のご意見には大きく賛同します。
とくに機械学習というAI技術は原理的に、既存にある情報やアイデア、やり方をデータとして参照した上で、それらを人間を超える処理スピードで組合せ、まとめ、答えを算出することを得意とする一方、我々人間にとって新規性のあるアイデアを生み出すことはやはり不得意とする傾向があります。
そうした新たなアイデアを探索し、イノベーションとして形作る方向にいかに人的リソースを割く余力を生み出せるかが、非常に重要なフェーズにあるのだと思います。
そのためには先生の仰るように、失敗を通した試行錯誤からアイデアを見つけ出すことを奨励する企業文化が必要で、もっと言えば"失敗"という捉え方すらも捨てることがとても重要なのではないかと感じます。
企業や人材を定量的な成果のみで判断するのでなく、プロセスで評価することがとても大切なのだと思います。
こう考えると、まさに「経路依存性」としての多くのトラップが今の企業内に複雑に絡んでしまっている実態を思い知らされます。
米オープンAI、13日に検索機能発表 グーグルに対抗=関係筋
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
複数メディアで5/13の発表が予想されているようですが、検索エンジンで圧倒的な力を誇るGoogleはにとって脅威になるでしょうし、我々ユーザーにとっても大きな節目になるのかもしれません。
一方、予想される機能としては、Bloombergによれば「新しい検索サービスはChatGPT用の拡張機能であり、チャットボットがインターネットを直接検索して出力結果にソースを引用できるようにするもの」とのことで、ChatGPTのUIに近いものを想像させられます。
個人的に大きな変革として期待しているのは、"キーワード検索"=検索単語が明確になっている、顕在化している必要があったこれまで検索スタイルが、"文章ベース検索"=あいまい検索も可能になるであろうことです。
言い換えれば「形式知の検索」から「暗黙知の検索」とも言え、これまで言語化・明文化できなかったインサイトに近いレベルでの探索ができるようになると、我々のネットスタイルは大きく変わるように想像しています。
企業としても既存のSEO(検索エンジン最適化)から、新たな対策を求められることになりそうです。
AI投資、首位米国10兆円 12位日本の100倍、23年
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
日米比較については、この投資金額だけでなく成果面でも日米に大きな違いが見られることが過去、複数の調査で報告されています。
PwCコンサルティングの調査によれば、AI導入によるROI(投資効果)を得られている企業は、米国で5〜6割程度なのに対し、日本は2割程度に留まります。(https://www.ipa.go.jp/pressrelease/2022/press20230209.html)
また広くDXをテーマとした調査ですが「DX白書」を発行しているIPAによれば、DX取り組みの「成果が出ている」と答えた企業の割合は、米国が9割近くになる一方、日本は6割程度とのことです。(https://www.ipa.go.jp/pressrelease/2022/press20230209.html)
その他、導入・検討状況が遅れていることも様々な調査で報告されています。
投資金額の割には成果がでいているのでコスパはいいのかもしれませんが…金額も少なければ、成果も出ておらず、導入検討も遅れてしまっている、これが日本企業の現状であることを強く認識しないければいけないのだと思います。
論文検索のポストGoogleか。事業開発を加速する「Memory AI」とは
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
素晴らしい技術ですね。
R&Dはその内容の新規性が高いがため、既存の検索エンジンベースの探索でキーワードを指定しても関連する研究論文や提携先が見つからない、キーワード自体が統一されていない、あるいはそもそもキーワードらしい単語が存在しないなどの問題が少なからず発生します。
そうした観点で、いわゆる"あいまい検索"が高度化されることは、リサーチ時間の大幅な短縮に貢献するものと考えられ、R&Dの高速化にかなりインパクトがあるのではないでしょうか。
行く行くは論文検索だけでなく、SNS投稿などマーケットリサーチなどにも展開が描けるのだと思うと、非常に今後に期待が寄せられものだと思います。
米巨大IT、AIで好業績 4社が増益、アップル減益
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
"生成AI需要の高まりを追い風に" とありますが、詳細が不明なため想像の域をでませんが、各社その中身はかなり異なっているのではないでしょうか。
Amazonは、クラウド開発環境のAWSが伸びを牽引していることは間違いありません。Microsoftは、同じくクラウドのAzureの伸びに加え、OpenAIとの提携によって確実に利用者を拡大しているはずです。
GoogleもクラウドのGCPが伸びているでしょうし、Google Pixelの端末販売も好調さが窺えます。一方で、生成AIのGeminiはまだ苦戦を強いられているような様子です。
そして、Appleは各報道からもわかるように、この波には乗り遅れている(あるいは後発者利益を狙っている)ことから減収減益という結果も頷けます。
個人的によくわかっていないのがMetaで、広告収入が90%以上を占めるビジネスモデルの中、生成AIがどのように増益に貢献しているのか(オープンソースのLlamaが収益に影響?)、想像がつかずにいます。ぜひ詳しい方に解説いただきたいです。
Figureとはいかなる企業か?「人型AIロボ」で驚異の1,000億円調達のワケ
和田 崇㍿Laboro.AI 執行役員/マーケティング部長
Figure 01は、身長168cm、体重60kg、1秒に1.2mの速度で歩行、電動で5時間稼働し、20kgの荷物を運搬できるそうで、かなり高性能なロボットではないでしょうか。
確実にやってくる人口減少を考えると、こうした人工の労働力は、コーヒーを入れさせることはないにしても、多くのシーンで必要になるテクノロジーなのだと思います。
AI=ロボットとも捉えられがちですが、AIが担うのは認識された画像や言葉、音声を処理するソフトウェア部分(人で言えば脳に当たる情報処理)のみで、ロボットには半導体はもちろん、それら情報を認識するためのセンサー、四肢を動かすためのモーター、バッテリーなど機械工学的な技術が詰まった、その時代の叡智が集結したテクノロジーです。
OpenAI、NVIDIAなど多くのテック企業が巨額出資していることからも、様々な分野の企業が集い、技術提供しながら、その高性能化をFigureをベースに実現しようという勢いが伝わってきます。
NORMAL
投稿したコメント