【革命】10秒でミュージシャン!Suno.aiのアップデートを試してみた

2024年3月6日
全体に公開

こちらのトピックス“生成AI最前線「IKIGAI lab.」”は、学び合うことを目的としたオンラインビジネスコミュニティ「OUTPUT CAMP meets AI」のメンバーで運営しています。

私、伊藤は普段、生成AIの導入・活用支援を行い、親子向けの生成AI体験イベントを開催しています。生成AIの情報を常にキャッチアップし、新しいツールに興味があれば実際に使ってみるのが私のスタイルです。

前回の記事はこちら。

音楽生成AIについて

音楽界でも、生成AIの活用は広がりを見せています。中でも、音楽生成AIのSuno.aiはその最前線を走り続けている1つです。最新のアップデートでは、これまでにない機能の追加と品質の向上が実現されました。この記事では、その詳細とSuno.aiが音楽制作に革命をもたらす可能性について探ります。

2023年12月29日にTOPICSオーナーの高橋さんが執筆されたSuno.aiです。

Suno.aiについて

Suno.aiは2023年12月下旬頃に突如現れた音楽生成AIです。当時の衝撃は凄まじく、誰もが「ミュージシャンになれる時代が来た!」と思いました。

実際に、作曲については初心者の私でも、素晴らしい音楽が作れるようになりました。そんなSuno.aiが2月26日にアップデートをしていました。

Suno.aiの利用について

Suno.aiは無料で毎日5曲(10パターン)生成できますが、商用利用はできません。

一方有料プランでは、年払いの場合は96ドル、月払いなら毎月10ドルの費用で月500曲(1000パターン)生成する事ができるようになり、商用利用が可能です。

操作画面はこちらです。赤色の部分が新機能です。左側一番下の赤い枠の部分を選んで「V3(alpha)」を選んでください。ただし有料会員でないと「V3(alpha)」は選べません。

バージョンアップでどう変わったのか

今回のバージョンアップでインストゥルメンタルな(楽器のみで演奏される)曲が創れるようになったのもとても大きな変化です。他にも以下の変化があります。

・生成が早い
・最大2分まで生成できる
・歌声が安定するようになった
・様々なジャンルに対応するようになった
・音のクオリティが良くなった

以上の内容を1つずつ解説します。

生成が早い

まず「V2」と「V3(alpha)」の生成の速さを比べると差が如実に現れます。

・V3生成まで10秒程度で生成が可能
・V2
生成まで1分程度かかる

音楽生成は他の生成AIと比べて仕上がりを確認するのに時間がかかります。

音楽自体を実際に聴いて確認しないといけないからです。

そのため、10秒程度で生成できるということは、本当にありがたく、更にはその性能のすばらしさに感心します。

最大2分まで作れる

「V2」と比較すると以下のような違いになります。

・V31曲あたり最長2分まで生成ができる
・V2
1曲あたり最長1分20秒まで生成ができる

1分20秒では曲の途中で途切れてしまう事がしばしばあったのですが、2分になると概ね良い感じで1曲が出来上がるようになります。

歌声が安定するようになった

これまでの「V2」に関しては歌声がやたら甲高い声になったり、声が割れてしまう事がしばしばありました。

今回の「V3(alpha)」については、歌声も比較的安定するようになりました。ただし伸びのある声を再現するのは難しく、音声が途切れてしまう事がしばしばあります。

更に嬉しかったのは、1曲の中で2人の歌声が再現できる事です。確率は低いですが女性の歌声と男性の歌声を再現できました。これはとても嬉しかったです。

実際に作った音楽です。

様々なジャンルに対応するようになった

J-POPやHIP-HOPなどのメジャーなジャンルは私でなくても、誰かがたくさん作っているので、ここでは他ではあまり出てこないジャンルにアプローチしました。

「V3(alpha)」は対応する曲のジャンルが増えました。これまでの「V2」では、純邦楽の再現ができませんでした。三味線や尺八、琵琶の音を入れるのは非常に困難で、できたとしても成功率は高くありませんでした。

ただ、「V3(alpha)」は純邦楽にも対応できます。伝統的と思われるような音楽や現代的な解釈が入った音楽も再現できるようになり、とてもバリエーションが増えました。これはとても嬉しい事です。

「V3(alpha)」にバージョンアップしたことによって、表現可能なバリエーションが増えたので以下の内容を試してみました。

・手毬唄、舟唄などといった民謡を生成AIに現代的にアレンジさせる
・歴史の一部を英語歌詞にして現代的な曲にする

試した結果どのようになったのか、具体的に掘り下げていきます。

手毬唄、舟唄などといった民謡を生成AIに現代的にアレンジさせる

京都の通りの名前を覚えるための歌でもあった丸竹夷(まるたけえびす)を作ってみました。

熊本の手毬唄「あんたがたどこさ」を作ってみました。

生成AIが考える民謡というのは伝統と革新が共棲する新時代のアプローチだと考えています。

これまで純邦楽のアーティストが現代的なアレンジを試みていて、とても聴きごたえのある音楽が非常にたくさんあり、私はとても好きでよく聴きます。

今回は生成AIの力を借りながら作曲してみたので、伝統的な曲の流れを汲んでいるわけでなく、ある意味でハルシネーションしていると言えるのですが、それがかえって良かったりします。

歴史の一部を英語歌詞にして現代的な曲にする

今回は平敦盛の内容を英語の歌詞にして、現代的な音楽にしました。Drum'n BassやHouseなどで作ってみました。歌詞の内容が平敦盛の内容と言うだけでDrum'n BassやHouseなどはSuno.aiの得意分野なので、いい感じに作ってくれます。

実際に平敦盛の情報をChatGPTに歌詞にしてもらい、曲を作ってもらいました。いくつか作ってもらいましたがその中の1つを共有します。

音のクオリティが良くなった

Suno.aiの音楽ファイルはMP3ファイルで保存されます。これまでの「V2」ではビットレートが128kbpsで、「V3(alpha)」では192kbpsで保存されるようになり、音のクオリティが向上しました。

しかし、実際に生成される音の質感を聞いてみるとそのビットレートに合うだけのクオリティではないように感じます。

もともと、以前の「V2」では音のクオリティが成果物によってかなりバラつきがあるように感じました。以下の内容は個人の感想です。

以前の「V2」は、重低音の再現は苦手だと感じていました。また、音声は甲高くなりがちで音割れもしていました。感覚的には、MP3ファイルを64kbpsで圧縮された音楽で再生した状態より音が割れているような印象がありました。

しかし、今回の「V3(alpha)」では、64kbpsくらい或いは128kbpsのMP3ファイルに届くかどうかの音の良さだと感じています。あくまで個人の感想ですが、確実に音質が良くなっています。

MP3ファイルとは

MP3は1990年代半ばから2000年代にかけてデジタルオーディオの主流フォーマットとして広く使われました。2010年代に入ると、ストリーミングサービスや高品質なオーディオフォーマットの普及により、その人気は徐々に低下しました。しかし、2023年現在でも広くサポートされ、多くのユーザーに使用され続けています。

音質について

MP3ファイルの音のクオリティはビットレートによって決まります。ビットレートの表記はkbpsになります。

kbps(キロビット毎秒)は、音声や音楽ファイルのビットレート、つまり1秒あたりのデータ量を表す単位です。ビットレートが高いほど音質が良くなりますが、ファイルサイズも大きくなります。一般的なkbpsの目安とその違いは以下の通りです。

64 kbps: 低音質で、主に話し言葉向け。音楽には不向きで、細部が失われがち。ファイルサイズは小さいが、音質を求める場合には不十分。

128 kbps: 標準的な音質。ラジオ放送やインターネットストリーミングによく使用されます。音質はまずまずですが、高音質を求める場合には物足りないことがあります。

192 kbps: 高品質な音質。これにより、よりクリアな音質が得られ、一般的なリスナーには満足なレベルです。

320 kbps: 非常に高品質な音質。これはMP3ファイルの最高ビットレートで、CDに近い音質を提供します。音楽愛好家に推奨されます。

まとめ

今回のSuno.aiのアップデートでは表現の幅も大きく広がり、音質もよくなりました!企業向けに楽曲提供をするにも充分なクオリティになりつつあると感じています。

ぜひ皆さんも自分の中にある再現したい音楽をつくってみてはいかがでしょうか。

応援ありがとうございます!
いいねして著者を応援してみませんか



このトピックスについて
樋口 真章さん、他2217人がフォローしています