「くずし字」AIが解読 ラーメン判別法も応用!
コメント
注目のコメント
まず最初に、ラーメンの判別という面白い試みをされていること、くずし字のコンテストで上位入賞されるなど高い技術力をお持ちであることに敬意を評します。また、くずし字判別等に関与している研究者も何人か存じ上げており、このような学問にも機械学習が貢献できることを素晴らしく思います。
その上で。無粋なコメントで失礼しますが、(記事の内容ではなく)少なくともこのタイトルは流石に誤解を招くと思ったのでちょっと独りごちらせてください。
このタイトルでは「ラーメン判別法も応用」とありますが、記事にある通り元々ラーメン判別法は一般物体認識技術を応用してあると書いてあり、今回のくずし字判別も一般物体認識の問題として解いたと書かれています。すなわち、「一般物体認識」という概念が上位であり、ラーメン判別法をもってしてくずし字を解読したというのは誤りとは言わなくても誤解を生じさせる恐れがあります。ラーメン画像でpre-trainしたモデルを使ってくずし字判別をしたのではないと思います。(もし私が誤解していて、ラーメンpre-trainedだったらものすっごく面白いですが記事からはそう読み取れません)
ラーメン判別に用いる際も、特にラーメンであることを積極的にCNNに教えているのではなく、あくまでも大量のデータから自動的に判別に有効な特徴量を捕まえているだけです。すなわち、ラーメンではなくテーブルの色や模様を見ている可能性もあるということです。この点についても記事中では言及があり、インタビューではかなり正確に注意しながらお答えになったのだと思います。だからこそ、逆にタイトルが残念に思われます。ラーメン判別!こういった親しみの持ちやすいプロジェクトから、ビジネスやアカデミックにインパクトのある価値をもたらすというのは素晴らしいです。ラーメン⇒くずし字の次に応用の効く技術に個人で取り組まれる時代にどんどんなってほしい。
結局何を学習したかで、何を判別できるかが決まるので、現代の文字を学習すれば現代の文字が判別でき、昔の文字を学習すれば昔の文字が判別できるということで、今の手書き文字認識くらいには出来るんだろうなぁという印象。
昔の人はこの文字でコミュニケーションをとっていたわけで、今の人にとって難しく見えるからと言って、機械的には難易度が上がるわけではないのではないかなぁと。学習出来る情報が少ないとか、文法的なルールを新たに導入する必要があるとか、難しい点はあるとは思いますが