2024年度AI予算、開発インフラに重点 倍の2000億円視野
コメント
選択しているユーザー
2024年度の生成AI政策では、政府がスーパーコンピューターと高品質AI学習データの整備に焦点を当てる予定であることが明らかになりました。
この政策はAIの進歩を目指す上で、大変良いステップだと思います。しかし、その前に、各自治体が総務省の「機械判読可能なデータ作成のガイドライン」を守るように指導することが重要だと感じます。
総務省「統計表における機械判読可能なデータ作成に関する表記方法」
https://www.soumu.go.jp/main_content/000723697.pdf
その理由は、AIが賢くなるためには高品質なデータが必要だからです。特に、公的データは量と質から言って、学習データとして使えるはずです。しかし、形式が適切でなければ、その価値半減です。
具体的には、「機械判読可能なデータ」というのは、AIが解析しやすいように整形されたデータのことですが、今の日本では、このデータ提供がちゃんとできていないのが現状です。
だからこそ、AI開発のためには高品質なデータが不可欠で、その供給源の一つである公的データの活用に力を入れるべきだと思います。
注目のコメント
2,000億円規模の予算を投じて、計算インフラ整備、データ整備、生成AI開発に乗り出すとのことで、国内開発力の向上に向けたポジティブな施策として受け止められます。
次は、民間企業側がその投資を上回る経済効果を生み出すようなサービス開発や事業開発に、このチャンスを活かせるかどうかも問われてくるはずです。
国のバックアップを無駄にしないよう、民間側でも人材育成を組織体制の整備をはじめ、足並みを揃えた準備を整えておくことが重要になりそうです。GPUサーバー代がボトルネックになるので、まずは良い取り組みです。
その上で公的なデータセット整備にも予算をつけて進めて欲しいです。100億パラメータ位を学習できる規模のデータと対話学習の人間フィードバック学習のデータセットです。
これらのデータを事前学習したオープンソースモデルを公開すると利用が広がります。各企業がやりたいのは、各社独自の社内データの学習だからです。AI開発で海外に依存する度合いを下げるため国内で研究・開発できる基盤を用意するために、政府が2000億円インフラ整備のために投資する、という話ですがインフラ基盤構築に必要なハードウェア、技術こそ海外が優れています。これを機に日本の基盤技術の発展につながることも期待したいですね。