Picks
191フォロー
15501フォロワー
3分ですぐ使えるようになる!ベイズの定理の概要と計算方法まとめ
AIZINE(エーアイジン)
山崎 俊彦東京大学 大学院情報理工学系研究科電子情報学専攻 准教授
ビル・ゲイツはディープラーニングが登場する前、マイクロソフトの経営がうまくいっている理由の一つにベイズ統計を挙げ、「これからはベイズ統計学の時代だ」と発言したと言われています。 さて、この記事の例だと  P(A|B) ・・・結果Bが原因Aで起こった確率(事後確率)  → メールに「お金」が含まれていた場合、迷惑メールになる確率 を求めるためにP(A|B) = P(B|A)P(A) ÷ P(B)という面倒な計算をしていて、逆に遠回りであるように見えます。また、この記事の例だとP(A|B)は簡単に計算できてしまうようにも見えます。 なので、もう少し問題を複雑にしてみましょう。 メールに「お金、成功、口座、ビットコイン」が含まれているかを考えましょう。含まれていれば1, 含まれていなければ0と表すことにすると B = (0,0,0,0) - (1,1,1,1) の16通りあるわけです。これくらいだったら全通り計算できそうですね。 注意しなければならないキーワードが20個あったらどうでしょう?約100万通りあります。100万通り全部計算するのは大変そうです。全部の通りを調べることができるでしょうか?その前に、あなたはこれまで100万通もメールのやり取りをしたことがあったでしょうか?ないならそもそも全パターンの確率なんて求められません。 そう考えると、P(A|B) は理想的には計算できるけど、現実的には計算不可能な値です。では、 P(B|A)P(A) ÷ P(B) の方はどうでしょう? P(B|A)は、スパムに上記20個のキーワードが含まれている確率を計算するだけなので、比較的簡単に計算できそうです (実はここもそれなりに工夫は必要ですが、割愛)。P(A), P(B)も簡単ですね。とすると、 P(B|A)P(A) ÷ P(B) は簡単に計算できてしまいます。 よって P(A|B) = P(B|A)P(A) ÷ P(B) よりP(A|B)も計算できてしまうのです。上では計算不可能と言ったのに、です。 これがベイズ統計のすごいところです。ちなみに、これはベイズ統計の入り口の入り口です。
26Picks
【必修】デジタルを動かす「プログラミング・ネイティブ」を育てる
国際共著論文の拡大へ。文科省が新たに支援する「国際先導研究」とは?
ニュースイッチ
山崎 俊彦東京大学 大学院情報理工学系研究科電子情報学専攻 准教授
海外に長期行くのは不安だったり面倒だったり予算が取れなかったりで、結構心理的敷居が高いことは十分理解できます。それでも、私は海外にというか海外に限らず別の組織に武者修行に行くことを強くおすすめします。 「同じ釜の飯を食う」という言葉がありますが、ちょっと一緒に共同研究するくらいでは駄目で、一緒に長期間行動をともにし、文字通り一緒に食事に行くくらいの仲間を作ることがその人のその後の価値になると思います。 私もチャンスを得て2年間在外研究をすることができましたが、その時の仲間はいまでも大きな国際会議に出れば「ラボの同窓会をしよう。Toshiも学会に来てる?」とメールが来るし、日本に来るとなれば「Toshi、東京に行くんだけど会える?」と連絡が来ます。というか、ノーアポでわざわざラボまで遊びに来ることも(苦笑)。教員になった友人とお互いに交換留学したこともありますし、企業に勤める友人にインターンの受け入れのお願いをしたことも。 後もう一つは、自分の組織にいると会議や雑用に忙殺されて落ち着いた研究ができるとは言い難いですが、他組織にお邪魔することで自由時間が増えるというメリットがあります。上記の海外にいる間は「今日も暇だ。よし、今日は20本論文を読もう」なんてことが普通にできました。研究のアイデアを頭から煙が出るまで考える日を何日も持てました。
NORMAL
Premiumを無料で体験
登録・ログイン