【最先端情報】史上最速AI Groq✖️Meta AI(LlaMA3)=最強なのか!?
こちらのトピックス“生成AI最前線「IKIGAI lab.」”は、学び合うことを目的としたオンラインビジネスコミュニティ「OUTPUT CAMP meets AI」のメンバーで運営しています。
ChatGPTやClaude、Geminiと米国超巨大企業がバックについた生成AIツールですが、いよいよそこにMeta(旧Facebook)のAIが殴り込みをかけてきました。
今日はそのMetaの提供するAIを中心に解説を行っていきます。
Introducing Meta Llama 3: the most capable openly available LLM to date.
— AI at Meta (@AIatMeta) April 18, 2024
Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes.
Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m
— AI at Meta (@AIatMeta) April 18, 2024
- 果たしてどんなことができるのか?
- 他AIとの比較
- OSSってなに?
- 最速AI Groq ✖️ Meta社のLLM = 最強!?
- さらに深掘り
これらについて一つずつ触れていきます。
【どんなことができるの?】
まず、大前提ですが、2024年4月22日時点で、Meta AIはそのままだと日本では利用できません。
とはいえ、そのままでは記事にならない!ということで、VPN接続で触ってみました(ここではこの説明は割愛します)。
もちろん、今回お伝えしたい記事の本題はこのMetaAIを触ることではありませんのでご安心を(笑)。きちんと使う方法を紹介します。
ちなみに、Chat機能はログインなしでも利用することができましたが、機能をフル活用するにはFacebookでのログインが必要な様です。
画面上現時点でできることは2つ。1. 対話機能2. 画像生成機能
対話機能
対話機能はChatGPTとほぼ同様で、日本語で入力が可能です。ですが、米国でのみ利用可能ということもあり、回答は英語です。ただし、日本語訳してという指示は通ります。
さて、LlaMA 3に聞いてみたところ、プロンプトエンジニアリングの観点ではChatGPTやClaudeと明確に違うところもある様です。
1. 目標を明確に定義する:* 何を達成したいのか、或いは何を知りたいのかを具体的に示してください。* 関連するコンテキストや情報を提供してください。2. 自然な言語を使用する:* 自然な質問やステートメントとしてプロンプトを組み立ててください。* 過ぎたる正式な、或いは構造化された言語を避けてください。3. 簡潔に保つ:* 数センテンス程度に抑えてください。* 直接的に目的を示してください。4. 具体的なキーワードを使用する:* 関連する用語やフレーズを含めてください。* トピックやコンテキストを理解するために役立ちます。5. 曖昧さを避ける:* 明確で曖昧さのない言語を使用してください。*漠然とした、或いはあいまいな質問を避けてください。6. 例を提供する:* 具体的な例やイラストを提供してください。* 何を探しているのか理解するために役立ちます。
7. 適切なトーンを使用する:* 尊敬とプロフェッショナルなトーンを使用してください。* 希望するレスポンスにマッチするトーンを使用してください。8. 明晰さを確認する:* プロンプトが易しく理解できることを確認してください。* 必要以外は隠語や技術用語を避けてください。9. 開放的な心を持つ:* 創造的、或いは予期せぬレスポンスに備えてください。* AIが生成するコンテンツの可能性を受け入れてください。10. 改善と反復:* 私のレスポンスに基づいてプロンプトを改善してください。* 継続的に改善し、適切なアプローチを採用してください。
これまで、ChatGPTやClaudeは構造化したinstructionが有効であることが確認されています。ですがLlaMAは簡潔にプロンプトを保つことを推奨しています。
もちろん、冗長なプロンプトは却って精度が下がるというデータもありますので一概にはいえませんが、LlaMAは簡潔さがキーワードになりそうです。
参照: https://arxiv.org/abs/2404.01077v1
また、プロンプトエンジニアリングについて最適な情報を聞いた中で開放的な心(寛容さ)が入っていることは興味深いですね。
画像生成機能
Meta AIでは画像生成も可能になっています。
精度に関しては画像生成AIツールのMidjourneyやStable diffusionと比較して劣るものの、OpenAIが提供するDALL-E 3と比較して、ややリアルな印象です。
また、editを押すと、画像のStyleを残しつつ、違う画像生成も可能です。
日本語で、博士をおばあさんにしてと伝えました。
Animateを押すと1秒のアニメーション動画に変更もできました。
【データから見る他の生成AIとの比較】
気になる性能評価ですが、Meta社からパフォーマンスについての報告がありますので、そちらを参考にしましょう。
興味深いことに、Metaの提供するデータでは、ChatGPTのGPT-4の比較がありません!
ちなみにGPT-3.5との比較ではLlama3 70Bモデルは圧勝しています。
これは、決して勝負を避けているわけではありません(笑)
単純にパラメーター数といって、ざっくりいうとAIのモデルが学習させている量の問題であり、GPT-3.5で約180Bですから、軽量モデル同士の勝負をさせているということです。
例えると、サーキットでトヨタのクラウンの様なセダンと、スズキのハスラーの様な軽自動車を戦わせないよね?ということ(車に詳しくない方、すいません!)。
大規模言語モデルはパラメーターを増やせば増やすほど、高性能かつ複雑なタスクに対応可能ですが、応答速度が遅かったり、それを支えるハイパワーコンピューターが必要になったりと、負の側面も指摘される様になりました。
【ChatGPTとは違うOSSとは?】
また、MetaはChatGPTを提供するOpenAIやClaudeを提供するAnthropicとは違う方針を打ち出しています。
それは、LLMがOSS(オープンソースソフトウェア)であること。
オープンソースとは、ソースコードが公開されており、誰でも自由に利用、改変、再配布できるソフトウェアのことを指します。
主な特徴として、
- ソースコードが公開されているため、誰でも中身を見ることができる
- 無償または低コストで利用できる
- 自由に改変や機能拡張ができる
- 世界中の開発者がそれぞれコミュニティを形成し、議論を交わしながら開発を促進することができる
といったものが挙げられます。一方でクローズドソフトウェアはこの逆ですので、ChatGPTの中身は非公開であり、学習させたパラメーターなども確認することができません。
開発者は、当然ながら低コストかつ機能拡張が容易なOSSモデルのLLaMAを利用して自社サービスを開発したり、より便利な利用法を共有したりとイノベーションが加速しやすいというメリットがあります。
【最速AI groq ✖️ Meta LlaMA 3 = 最強!?】
そこで登場したのが、Groqという半導体スタートアップが開発したAIモデルです。Groqの詳細は、会員限定ですが以下の記事を参照してみてください。
Groqは独自のLPUと呼ばれる技術を用いて、AIからの出力を高速で返すことが可能です。Groqを使う場合はこちらからアクセスしてみてください。
実際の画面はこちら。シンプルなUIになっています。
GroqのAIモデルの中には、これまで仏のスタートアップMistralのMixtral 8などが利用可能でしたが、ここに、Metaの最新LLMであるLlaMA 3が導入されました。
つまり、Meta AIが無料で使えるのです!冒頭にお話しした米国限定は一体なんだったんだ!?(笑)
さらに驚くのはAIからの回答の速さ。Groqを利用すると、出力のスピードが表示されます(〇〇 トークン/秒)。
早速利用してみました。
LlaMA 3 70bモデル利用。1秒間に300tokensを出力します。
右上のモデルを選択し、LlaMA 3 70B へ変更するだけ!とても簡単です。
ちなみに、その隣の歯車マークでSystem prompt(インストラクション)を保存することができます。
出力結果はすべて英語ですが、日本語に翻訳して、と伝えると日本語に翻訳もしてくれます(が完全ではありません)。
また、GroqはiPhoneアプリも出しています。
Test flightと呼ばれるテスター用のiPhoneアプリをローンチするアプリがあります。ここで公開されています。
※残念ながら、現時点ではテスターが定員に達してしまったため新規の登録はできない様です(2024年4月24日現在)。
Test flightの利用は比較的簡単(ただしApple公式ではないので、十分注意して利用してください)
それでも、スマホで使いたい!!という方にもう一つ方法を教えます。
Groqの公式サイトです。QRコードから読み取るか、先ほどのリンクをスマホで開いてください。
【さらに深掘り】
さて、ここまで解説してきたGroqとLlaMA 3の組み合わせが何やらヤバそう。ということがわかっていただけたかと思います。
それでは、実際の実力を試してみましょう。
ぜひ、動画でGroqの実力をみていただく方が衝撃度は大きいかと思います。
タスク1:数を数える
1から100までの整数を順に数えてもらいました。
敢えてGPT-4と比較しています。
・・・びっくりするぐらいChatGPTが遅い(笑)
あまりの遅さに、LLMのモデルを2つ試す余裕までできてしまいました。
タスク2:夕飯のレシピを考える
こちらも、ChatGPTと比較し、Groqはレベチです。英語で出力されますが、日本語に翻訳してもお釣りが来ます。
タスク3:コードを書く
簡単なPythonコードを書いてもらいました。こちらも正確さは同等、速さは圧倒的にGroqでした。
また、スマホでもGroqのスピードを確認してみました。先ほど解説したTest flightのGroqアプリのデモをご覧ください。
いずれも等倍速で収録したものですので、Groqの速度はこれがリアルです。
実際の生成速度を測ったところ、このスマホ版では2秒01でした。
【最後に】
いかがでしたでしょうか?
アウトプットのスピードに衝撃を受けた方も多いのではないでしょうか?
回答の質も簡単な指示であればこれまでのLLMと比較しても遜色ない印象です。
さらに速度以上に出力の内容がOSSであるLlaMA 3であることにも注目です。今後、日本語に特化したモデルや、分野ごとの特化モデルなどがOSSをベースに作られることも考えられます。
これまでChatGPTやClaude 3が注目されてきましたが、今後はOSSであるLlaMAにも大きな注目が集まると思われます。
引き続き皆さんに生成AIの情報をお届けしてまいりますのでぜひフォローをお願いします!
また、X(旧Twitter)やnoteでも発信を行っています。ぜひこちらもご覧ください。
(サムネイル画像:Niji journery, Canvaで作成)
※2024.4.25 08:50 一部表現、動画リンクを修正しました。
最後にお知らせです。
オンライン×名古屋で生成AI-EXPOを開催(5月6日)
IKIGAI lab.の伊藤雅康さんと田中悠介さんが主催として、名古屋で生成AIイベントを開催します。
コンセプトは、AIと一緒に「好き」を伸ばそう。
①イオンモール ナゴヤドーム前 1Fサウスコートにて、子供と一緒に生成AIを体験できるブース
②名城大学にてオンラインまたはリアルで参加できる生成AIセミナー
があるため、オンラインでも参加することができます。
参加費は無料です。
私たちIKIGAI lab.メンバーも登壇いたしますので、ぜひご参加ください。
▼ホームページ&参加申込はこちら
生成AI EXPO in 名古屋中部地区最大級の生成AI体験イベント「生成AI EXPO in 名古屋」のページです。
▼PR Timesにて掲載していただきました
最後までお読みいただきありがとうございました!
更新の通知を受け取りましょう
投稿したコメント