新着Pick
204Picks
Pick に失敗しました

人気 Picker
これは第一歩だと思いますが、私にはこれに関連して、以前から暇になったらやってみたいことがあります。
 それは、沢山のミュージシャンの年齢を経ることによる演奏の変化を人工知能技術で学習させることです。人が歳を取ることによる演奏の変化には、明らかに法則性があります。大雑把に分類すると、マイルス・デイビスのように常に時代の変化を肥やしにしながら変化し続けるタイプの人と、ビルエバンスのように自分のスタイルを深め続けた人がいますが、どちらにせよ若いときの、初々しく張り詰めた表情が、年をとるとより円熟して落ち着き、ある種の深味が増していきます。もちろん言葉では表現できないもっと多様な変化がありますが、そのようなことをモデル化することこそ、機械学習が最も得意なことです。
 これができれば、例えば、クリフォード・ブラウンやスコット・ラファロが長生きしていたらどんな演奏をしていたかを予想したり、現代の演奏家と共演させたりすることができないかと妄想しています。
 音楽は、データ化しやすいものなので、十分実現性はあるのではと思う次第です。
この研究の使い道は、(すでに亡くなった)人間の表現を再現できる、ということですね。単なる再現ではなく、故人が新たな創作をする、モーツァルトがジャズを作曲する、レオナルド・ダ・ヴィンチがベトナム戦争の情景を壁画に描く、ヒトラーや毛沢東が現在の自国の政治について演説する、といったことができるようになるための下準備、になるでしょう。
 AIの向上とは、現在では、コンピュータが認識能力を高めることに重点が置かれています。これは、言語や画像、音声を数学的に処理して表現できるようにするということです。20世紀の数学や言語学は、これを強力に推進しました。人間の思考や行動についてもまた数学的に処理して認識する方法が急発展しています。
 芸術をAIが認識できるようにする、ということは、芸術から神秘を剥ぎ取るということです。もし芸術表現が天から与えられた才能だか霊感だかを必要とする無二のものであれば、数学的に処理して表示することなどできないでしょう。限りなく膨大な計算ができるコンピュータが数学的に表現できる、というのであれば、それは神秘でも無二のものでもないでしょう。
 ですから、AIが芸術を認識できる、とうことは単に演奏を再現する機械をつくる、ということではありません。人間の世界についての観方が変わるということです。あれは神秘でもなければ霊感でもない、膨大な数字の寄せ集めに過ぎない、という風にみるようになります。これは何もAIが始めたことではなく、近代科学が積み重ねてきたことです。
興味深い取り組み。 先日 NHKでも放映されたが、「美空ひばり」をAI で復活させ新曲を歌う試みも。
記事で語られている問題点を解消するのは、100時間というデータがあまり十分ではないかもしれませんね。本人によるデータは有限ですが、何らかの工夫をして新しいデータを創出する方法を編み出さないと、結局は人間のジャッジが入ることになりますね。
その点、将棋などのゲームは新規データをいくつでも創出できるので、Deep Learningに向いています。
おおおおグレン・グールド!ボイジャーのゴールデンレコードに収録されたバッハのピアノ、彼の演奏です。いつか宇宙人が聞く日が訪れるのでしょうか。

そしてこれも面白いMLの活用法。データもたくさんありますしね。Deep Learning革命は手法としてはひと段落した感があって、使われるのはだいたいCNN、LSTMとか。ツールも整備されてきて、誰でも使えるようになりました。何に応用するかというアイデアが重要なフェーズになってきたと言えるでしょう。
エンジニアとして「ピアノを弾く」という行為にこだわる気持ちは理解できますが、リスナーとしては、実際に弾かなくとも、音源的により近く再現していればうれしいです。

何故なら、この方式だと、自動演奏ピアノがなければ聴けませんが、音源があれば、ピアノなしでも聴けるからです。

このように、「技術者の嗜好」で開発するか、それとも「リスナーの嗜好」で開発するかで、生まれる市場は大きく変わります。
グレン・グールドの前かがみの演奏は独特です。それをAIで表現したヤマハのレポートです。彼らしさを出すためのいろいろな工夫がおもしろい。
芸術×AIあるいはCreative×AIは、面白い発展をみせていますね。
AI開発には定量的な評価が不可欠なのに、数値化しづらい芸術分野でこれだけ進展するのはやや意外です。

自分の芸術的感性に従って突き進んでゆく、AI開発者の強いこだわりを感じます。私も何か創ってみたいのですが、芸術的感性に乏しすぎます・・。