新着Pick
429Picks
Pick に失敗しました

人気 Picker
椿先生は応用統計家として、本当に様々な分野のデータを見てこられた先生です。だからこそ、統計は社会技術であって、どう使うかは使う側の倫理に委ねられているということを体験としてよくお分かりなのだと感じました。

データドリブン意思決定とか、エビデンスベースドなんとかがどんどん出てくる時代だこらこそ、倫理について考えてみることも大事なのだと思います。

【追記】
川崎先生の経済の話で興味を引かれたのは、イノベーションが本質的に予見できないので、長期予測は難しいという話。テクノロジーのロードマップはありますが、それを予測モデルに取り込もうと思っても、そう簡単にはいかない悩ましさがあります。ここで言ってるイノベーションはテクノロジーに限りませんし、計測は非常に難しいものだと思います。

あと、株価についてはランダムに見える動きが、有事に突然ランダムでなくなる、というのも難しいですよね。サイコロを振っていたつもりが、ある日突然1だらけのサイコロになる、という比喩はとても分かりやすく、そして恐ろしくもありました。
予測に足る必要十分なデータが入力として与えられ、統計モデルにうまく乗っかるものが予測できているに過ぎません。

例えば、

東大が開発した「AIで広告効果を予測する技術」の中身
https://newspicks.com/news/4220653

で取り上げていただいた広告のクリック率は相関係数0.55で予測できるわけですが、たった0.55。この間セミナーでこの技術についてご紹介したら「どうしたらもっと向上できますか」とご質問を受けました。広告を好きだとしてもクリックするか、その日の気分にも依ったりするのでなかなか難しいものです。

また、最近ホテルのダイナミックプライシングが話題になっていますが、ホテル宿泊者数に最も効くのは過去の客数や天気などではなく、その日ジャニーズのコンサートもしくは医療系の大きな学会があるかどうか。そういう情報をオープンデータから取ってきてAIに与えるのは意外と難しかったりします。

そして、説明性がいまホットトピックとなっていますが、人間の直感(とそれに対する本人の説明)って案外当てにならないという例を沢山しっているので、どこまで説明性を担保すべきかはそろそろちゃんと議論したほうが良いと思っています。
この記事はすごく勉強になりますね。学校で勉強すべき数学の筆頭は統計学だと思いますが、あまりやらなかったりするんですよね。統計分布を復習するだけで人生が変わるかも。
予測に関する特集で記者が統計のプロにインタビューしていたら、話は「日本に統計の専門家が少なすぎる」という方向に。データサイエンスという言葉が脚光を浴びる半面、それを支えるプロが不足しているという現状のようです。NPピッカーでもある同僚、西村宏治記者の取材です。
この↓メカニズムって何なんですかねぇ? ある事象に「メカニズム」があるかどうか、またその「メカニズム」が「理解」できたかどうか、人間が単に決めているだけではないのですかねぇ、成長課程で身に付けた 、「ロジック」という、少し抽象度が高い故汎用性のある "black box" パターン認識で

あ、ほとんどの人類が左利きの時代がずっとつずいていたり、進化過程で他の指と可動方向の違う親指が発生しなかったら、また別の文字の断片が「好まれ」、その結果文字は違った形になっていたと思いますねぇ そういう帰結は「メカニズム」なんですかねぇ。。。

スイマセン、ワタシ、こういうこと言って学生さんをinspireするのがシゴトなので、ついついクセが。。。

「これは文字を分解したデータから予測していくのですが、文字の断片が文字になるメカニズムはありません。文字はメカニズムで生まれるのでなく、人間が単にこうだと決めているだけだからです」
2016年以降は保護主義の台頭で経済が合理的に動かなくなってしまっていますので、AIでも経済予測は難しくなっていると思います。
予測は難しいですが、予測を正しく理解してもらうのはさらに難しいです。

 |保険のように「大数の法則」がきくマクロの場合は別ですが、
 |誰がどうするといったミクロの行動の予測というのは、
 |難しいかもしれません。
特にマクロとミクロの用途の違いは、分かってもらえませんね。
問題の要求に対して「予測」として回答できる数学的帰結というのは、数学的な収束の解を出せるものに限られるはずです。社会的に問題となるのは人間の経験的な感覚値と統計解が逆転する例です。

経済指標などは典型的な例で、関与する係数の数が無限大なので予測値は厳密に計算すればするほど発散します。発散する解からは何の有用な予測を立てる事は出来ないので、任意のフレームを用意してその範囲でのみ通用する解を当てはめます。

そうすればある種のフレーム内では収束する解を得られるので、予測値を出す為には経験値に基づいたフレームを沢山用意して、どれかに当てはめて予測値を出すことになります。この経験値に基づいたフレームの選択こそが投機性であり、端的に言えばギャンブルです。

そのフレームが、ちょっと前だと統計アルゴリズムであり、最近は機械学習によるニューラルネットになります。仮にそのフレーム選択の抽象度を上げてこれすらも機械学習に任せたとしても、任意のフレーム選択のレイヤーが上がるだけで、本質的に投機性が消える事はないという事が分かると思います。

逆にそうやって無限大に予測値精度を求めるようになった世界において、ちょっとした係数値がある特定の人間によって任意に操作出来る場合、例えばある国が戦争を始めたりする事によって、予測アルゴリズムや機械学習は破綻を来します。こういうものはシミュラティブであるが故にそうした予測を立てやすいので、パニック誘導をして不当に利益を得る人が現れても何らおかしくはありません。
その日の気分で機嫌が良かったり悪かったりするヤツがいるので、それをAIが予測できたら大したものです。
自己啓発の動機付けで、統計検定を受けようかと。