SXSW探訪記①スタートアップピッチ編〜AI/Voice/Roboticsカテゴリ〜

2024年4月3日
全体に公開

しばらく間が空いてしまいましたが、3月8-16日にアメリカテキサス州はオースティンで開催された大規模なテクノロジーイベント、サウスバイサウスウエスト(通常SXSW)に参加してきましたので備忘がてらまとめていこうと思います。正直SXSWへの参加はついでだったのですが、事前の想像以上に面白く、自分自身としても色々と学びもありました。

SXSWとは?

(ご存知の方も多いかもしれませんが・・・)SXSWとは、毎年3月にテキサス州オースティンで開催される音楽、映画などのサブカルチャー、スタートアップや最新技術などが集まる企業カンファレンスなどが一緒くたに実施される大規模イベントです。歴史的にはもともと音楽フェスティバルから始まり、徐々に領域を広げて今の形になったとのこと。

米テキサス州オースティンで、毎年 3 月に開催される世界最大級のテクノロジー、映画、音楽、教育、文化が融合したコンバージェンスカンファレンス & フェスティバルです。
1987年に音楽祭として創設された後、世界中のクリエイティブな人たちが集まる場に成長しました。

ライブショーケース、映画上映、展示会、セッション、ピッチに加え、ネットワーキングの場を提供していて、日本からの参加者は年々増え続けています。
SXSW日本語公式サイト(https://miraiyoho.com/sxsw)より

私はずっとテクノロジーやスタートアップ系のセッションばかりに参加していたので音楽や映画のほうを全く攻められなかったのですが(後で知りましたがライアン・ゴズリングとかメーガン夫人とかのセレブリティも参加してたらしい・・・)、正直体一つでは回りきれないくらい多数のセッションが開催され、参加者ごとの興味関心にあわせた多数のセッションやネットワーキングイベントが開催されていたようです。

本当に色々なコンテンツが毎日ひっきりなしに開催されていていたようですが、私はその中で下記のような3つを中心に体験してきました。

①スタートアップトラック: スタートアップのピッチや投資家、起業家中心のセッション
②AIトラック: 生成AIやAGIなど、新しいAI技術に関するセッション
③2050トラック: 25年後の2050年を見据えた新技術や未来思考に関するセッション

今回は①スタートアップトラックの中でも、シリーズA前後のアーリー目のスタートアップが多数出場していたピッチイベントについて順にまとめて行きたいと思います。

SXSW Startup Pitchの全体像

スタートアップピッチは実際には企業カテゴリごとに合計9つのセッションに分かれてコンテスト形式開催され、各カテゴリごとのwinnerを選出するという形で行われていました。開催されたカテゴリは下記の通り(※太字は私が実際に見れたもの)

1. AI, Voice & Robotics
2. Enterprise & Smart Data
3. Extended Reality and Web3
4. Food, Nutrition & Health
5. Future of Work
6. Innovative World Technologies
7. Smart Cities, Transportaion & Sustainability
8. Student Startup

各社のプレゼン時間はきっちり3分ずつ。3分超えた瞬間にマイクの電源をかっちりと落とされてしまうので、各社相当練習してきていたのが印象的(拙い私の英語力だとかなり辛いレベルの早口でした・・・)

割と印象的だったのが、各セッションに補欠合格企業が2-3社ずついて、コンテスト終了後に1社1分ずつ、資料投影なしのセッションも行われていました。資料使って3分より資料なしで1分間のみのピッチの方がより難易度たかいよなー、と出場されている方々のピッチを聴いて心から感心していました。

全てを見るにはあまりに裏被りしているセッションが魅力的だったので一部カテゴリしか見られなかったのですが、色々と魅力的なスタートアップもいたので何回かにわけてざーっと紹介できればと思います。

なお大半のスタートアップがシードラウンド〜シリーズAくらいのステータスで積極的に投資家を求めている、という話だったので、日本のVCや企業からも投資できるチャンスがあるかもしれません。新しい事業アイディアのヒントになりそうなサービスもいくつかあったので、ぜひご覧ください。

ピッチしている様子。会場は300名程度のそこそこ人の入る広さ

今回は「1. AI, Voice & Roboticsカテゴリ」の発表5社をざっとご紹介できればと思います

Autonomize

Autonomize社webより

医療系の各種非構造化データを生成AIを使って整形し、生成AIを使ってさまざまな用途に利用できるサービスを提供。「Healthcare Copilot」というキーワードがプレゼンでも出てきていましたが、まさに生成AIを使ったわかりやすいアプリケーションという感じです。

医療系ワークフローはUSにおいても非常に無駄が多い一方、非構造データが多すぎてこれまでは人間以外が扱うことが難しかったとのこと。確かにマルチモーダルな生成AIの活躍する余地は非常に大きそうです。

Autonomizeのプレゼンの様子

病院内部でのワークフロー改善に加えて、患者さんが保険を受け取るための書類作りなんかにも利用可能。製薬会社の治験マッチングや保険会社の償還などですでに3億円程度の売上を立てており、大手企業でも導入済み。

技術的には、汎用的なLLMを利用するだけでなく自分たちでもデータ学習させ特化型LLMも作っているとのことでした。

Carvis

CARVISのマルチモーダルAI

中古車の検査や査定をアプリ一つでできるようにするサービス。マルチモーダルAIを用いて、単なる車両モデル情報だけでなく、カメラによる画像認識・LiDARセンサーなどの光学的情報・エンジン音などの音声情報など複数の情報を認識し、わずか5分程度で総合的な中古車査定をAIが実行してくれるとのこと。プレゼンによればエンジン異音なども80%以上の精度で検査できるそうです。

すでにヨーロッパ中心にビジネスは展開しており、1スキャンあたり$25というわかりやすい価格体系でローンチ済み。こちらもマルチモーダル技術をうまく利用した非常に面白いサービスでした。

Gan.ai  (※カテゴリーウィナー)

ビデオ生成と音声生成を利用し、撮影済みのビデオの中にリップシンクを後から埋め込んでパーソナライズされた映像を生成できるサービス。人名をテキスト入力すると、ちゃんとビデオのリップシンク(口の動き)も同期する形であなたの名前を音声で読み上げてくれるように映像が生成されます。

たとえばWeb CMのなかで「こんにちは〇〇さん、この商品を買ってくれてありがとう!」とユーザーひとりひとりの名前を読み上げて話してくれれば、ユーザーエンゲージメントは非常に高くなると容易に想像がつきます。

すでにSamsungの広告キャンペーンで利用されているとのこと

実際、有名スポーツ選手や芸能人がユーザー一人一人に直接問いかけてくれるような映像を簡単に作ることができるということで、スポーツチームのファンエンゲージメントや広告パーソナライズ化などのユースケースですでに利用されているとのことでした。

実際デモも体験させてもらいましたが、ビデオの中の芸能人の表情・音声だけでなく、映像に出てくるスポーツチームのユニフォームの背番号の名前を私の名前に変えたりと、ビデオ生成系としてはかなり面白いサービスだと感じました。

ちょうど大統領選挙が近いので、たとえばトランプが投票者一人ひとりの名前を読み上げてキャンペーンを展開するなどに使うととんでもない効果を生みそう。他方、悪用すると超高精度なオレオレ詐欺みたいなことにもなりかねないので、かなり慎重に使わないといけないサービスだとも感じました。

結局このGan.aiがカテゴリーウィナーとして選出。

Mypart

全く新しい音楽のレコメンドエンジンを提供するサービス。好きな曲を入力すると単に同じアーティストの曲をレコメンドするのではなく、曲の歌詞やムード、リズム、曲調や含まれるキーなど「音楽そのもの」を解析し、類似性の高い曲をリコメンドしてくれます。

それによってこれまでになかった新しい音楽との出会い方を提供してくれる、とのことでした。

音楽解析のイメージ

すでに「Songhunt」というサイトでサービスも公開しているようですが、確かに好みのムードに近い曲を色々と提案してくれるので、自分がまだ出会っていない好きな雰囲気の曲を探したい時にはうってつけかもしれません。

まだ日本のアーティストはあんまり登録されていないようでしたが、Spotifyのおすすめが固定化しがちなのでこういうサービスを利用するのはDigが捗りそう。すでにUniversalやDefJamなど多くのレーベルとも提携しているようです。

Songhuntのイメージ。Bruno Marsの曲を検索すると、Bruno Mars以外の似ている曲を提案してくれる

nava AI

AIチャットボットとの対話で複雑なアメリカ移民プロセスを簡単に申請できるようにできるサービス。アメリカのビザは種類が多く複雑で、弁護士に支払う申請コストなどもかなり高くついてしまいます。特に移民をしてくる人はそもそも低所得の方もいるとのことで、費用的にビザ申請をしたくてもできないケースもあるとのこと。

さらに移民関連の法律やルールは定期的に変わってしまうので最新状況をキャッチアップするのも大変ですが、常に最新ルールに適応したプロセスを支援してくれるようです。

Navaをつかうことによって自分にあった申請カテゴリをAIが選んでくれ、AIとのやりとりだけで必要なドキュメントの準備が完了。最終的には移民弁護士のレビューを経て実際の申請までも一気通貫で進めてくれるようです。かつ自分の母国語に自動翻訳してくれるとのことで(※現状はスペイン語と英語のみ対応)よりスムーズに手続きをできるようになるとのこと。

navaのサービスフローイメージ

5月ごろにサービスイン予定で現状はビザ取得を希望する本人向けのみとのことですが、今後は家族ビザや労働許可証の取得など、関連する各種手続きにもサービスを広げていきたい、ということでした。

こちらは移民の多いアメリカならではのサービスかなと思います。ただビザ申請は同じ人が継続的に利用するというより申請一回だけの利用になってしまう気がするので、今後リカーリングするビジネスに広げられるかがポイントになりそうな印象。

AI, Voice & Roboticsカテゴリ総括

2023年は生成AIが急激に広がり間違いなく今一番ホットな領域。個人的にも一番期待して参加しましたが、実際参加していた聴講者が一番多かったカテゴリだと思います。

改めて記事を書きながらピッチに出ていたサービスを眺め直してみると、やはり生成AIのインパクトなのか、マルチモーダルな情報をうまく処理してペインの解決に落とし込むというサービスが多いように感じました。
* Autonomiza: 医療関連の非構造化データ
* Carviz: カメラ画像、LiDARセンサ、エンジン音
* Mypart: 音楽データ(歌詞、曲調、リズムなど)

またnava AIのように、生成AIによる高性能チャットをユーザーインターフェースとして利用することでユーザー体験の価値を上げるような取り組みも全般的に見れる特徴かと思います。今回紹介したサービスだけでなく、他のカテゴリにおいても生成AIによるチャットベースのUXを起点にしているサービスは色々とありました。

次回以降、別のピッチイベントの登壇企業の紹介もまとめていきたいと思います。

応援ありがとうございます!
いいねして著者を応援してみませんか



このトピックスについて
津覇 ゆういさん、他778人がフォローしています