新着Pick
1428Picks
Pick に失敗しました

人気 Picker
新型コロナの拡大で、世界はデータの洪水に見舞われました。

パンデミックという現象を、さまざまな角度の数字で分析は大きな前進だった一方で、怪しいデータもたくさん登場し、インフォデミックという言葉も取りざたされました。

今回取材した統計学の権威であるシュピーゲルホルター氏は「データリテラシーは現代の必須スキル」だと言います。

とはいえ、それを身につけるためには、統計学の難しい公式や、データサイエンスのアルゴリズムが必要だという話ではありません。むしろ、データから、何かを学ぶためには「アート」が必要であり、それを実現するための、データサイクルというものがあるのだと指摘しています。

今や欧米で引っ張りだこのシュピーゲルホルター氏への直撃取材から、ぜひ新たなデータへの気付きを得ていただければ幸いです。
まさに、と感じる。
データと、そこからのメッセージ(データからの解釈、仮説をサポートするためのデータという位置づけ)は違う。現実としては、メッセージはPPDCAのProblem・Plan・Dataを行き来して試行錯誤をしながら、決めていったり精度を上げるもの。その行き来から見るデータとメッセージを決めるのはアートそのものだと思っている。

人間は、経験という定性理解からこれをめちゃくちゃ効率的にできる。将棋や囲碁で、機械がものすごいエネルギーを使っているのに対してトップ棋士の消費エネルギーは普通の食事で、ものすごく効率的。これは経験という大局観から考えることを極めて絞り込んでいるから(計算の物量では、もう数十年前から計算機の方が強い)。
だから、下記のワークマンにあったようなどんなにがんばっても「当たり前の結論」になりがち。ただそこでも書いたが、それが出るようになったことはすごい進化だし、そこに早くたどりつけると、これまでは定性理解だった多くのことが定量説明もつき、そしてそれをもとに議論をできる企業は強いと思う。そこにExcelを使おうがAIを使おうが手段の話で貴賤はなく、「目的に対して適切なツールを適切に使えるか」が全て。
https://newspicks.com/news/5295098
データの取扱いというのは、本当に難しく、そして、数字などのファクトを読み取り、正しく分析し解釈することは、世の中にとって極めて重要です。逆に言えば、同じデータであっても、本質的理解を欠いていれば、あるいは、恣意的に、事実とはいえない解釈を導き出すことが可能になってしまう、ということです。

例えば、「〇〇の薬が効いた」、「うがい液が効果がある」、「△△をすると、◇◇になる確率が〇%高まる」・・・といった表現が、残念ながら世にあふれていますが、こういったことは、かなりの数の被験者について、前提を正しく設定して、精緻な比較試験を行い、その生データに必要な統計学的調整などを加えた上で、はじめて言えることです。

例えば、薬の有効性は、大規模な治験を行い、当該疾患を有する患者さんを、その薬を投与するグループと、プラセボ(偽薬)又は標準的な薬を投与するグループとに分けて、統計的に優位な差があるか、ということを証明して、はじめて言えることです。

また、「たばこを吸うと◇◇病になるリスクが〇%高まる」という話は、多数の人間を長期間観察し、喫煙以外の要因(年齢、食事や運動などの日常生活、既往症等々の違い)の影響を取り除く複雑な調整等をして、はじめて分かることです。

ですから、新型コロナ禍で、国民的関心の高いこうした事項について、責任ある立場にあるはずの方々から、データ分析や統計の知見をお持ちとは思えない、無責任なあるいは過度に楽観的な「見解」が飛び出す度に、この国は、だいじょうぶかいな・・・、と心配になります。

ちなみに、わたくしは、厚労省に入って仕事をする中で、政策立案の前提となるデータの提示のされ方に「ん?これを鵜呑みにしちゃ、いけないんじゃないか?」と疑問を抱き、根拠に基づく政策立案・客観的な説明をきちんと行えるようになろうと、留学して「パブリックヘルス」を学びました。

自分は知らないことばかりだと、今も常に思う日々です。
それを、「アート」と呼ぶのかは表現の問題でしょうが、データそのものは何も語らず、仮説だったり解釈だったりが大事という意味だと理解しました
昨日の記事でもコメントしましたが、今日の記事の例であれば、100人中6人なのか7人なのかの違いを「2割多い」というところだけを強調して伝えるのが良いのかはケースバイケース
また、仮にこれが有意に相関していたとしても、例えばベーコンを食べる人、というのが何らかの属性を表していた場合は(豊かな人は食べる、逆に貧しい人は食べる、最近の人は食べる、特定の人種は食べるなど)、そちらが真因かもしれない、という昨日もあった相関≠因果という問題もあります
また、教科書的には「仮説なく分析してはいけない」と言われますが、いろいろな軸をとってみてそこから仮説が生まれることも往々にしてあって、記事の例だと死亡場所と死因(コロナ)にフラグ立てをしてグラフ化したから見えてくる仮説もあるのは実務的な感覚ともよく合います
昨日の記事ではコミュニケーション=伝えるためのチャート作成の方法を解説しました。

【保存版】データは、こうして「視覚化」せよ
https://newspicks.com/news/5281306

データをうまく視覚化する秘訣はいきなりチャートを作らない、誰のためになにを伝えるのか具体的なメッセージを作ることから、とお伝えしました。

そのメッセージは、本記事に書かれているデータありきで何か言えそうなことを語るのではなく、問題や目的を明確にしてデータサイクルをまわしながら見つけていくものだと思います。

昨日の記事にすこし疑問を持たれた方、もっと深掘りたい方、チャートを見る側のリテラシーを知りたい方などなど、ぜひ、合わせてお読みいただけるとうれしいです!
サイエンスとアートの両方が必要というのは本当にそのとおりだと思います。本質的な目的をみつけるのはそんなに簡単ではなく、右脳的なアプローチででてきた示唆がでると、おおーってなります。「何が存在していないのかに気づくことは一番困難です」という言葉にしびれました。

" 私がよく言うのは、「そもそも、この話をしている人の動機は何なのか?」というところから考えることです。「この数字を信じていいのか?」「そもそも何を意味するのか?」と疑問を持つことです。ただ、これは非常に難しいことでもあります。一番難しいのは、「私が言われていないことは何なのか?」ですね。

何が存在していないのかに気づくことは一番困難です。"
本日も『本当のデータ思考』シリーズ、興味深く拝見させていただきました。

> 私は「統計学のアート」と言い続けているのです。これは単なるツールのセットではありませんから。
シュピーゲルホルター氏の『統計学はアート』という言葉は印象に残ります。

弊社はDXを取り組むプロフェッショナルの一つとしてデータサイエンティストを育成しています。

データサイエンティストは、記事でもある通り、データの背景を深く理解し、そこからストーリーとしてなにかしらの示唆を導き出し、それを表現することが求められます。お客様の業務を深く理解し、ストーリーとして語れるデータサイエンティストを今後も伸ばして参りたいと思います。
「数字自体が自ら話すことはない。我々が代わりに話し、意味を吹き込むのである」

データの読み方がアートというのは、言語化できる理屈の先を超えたプロのセンスが必要という意味で、どのような分野でもアーティスティックなセンスが大事だと考えている私には、妙に腹落ちする言葉でした。

前職時代は、株価のバリュエーションはアートだと常々叫んでいたのを思い出しました。
データは伝えたいことの論拠を示す単なる道具、というのはよくわかります。AIが数字の羅列をガラガラポンして、ストーリーを語ってくれるというのは、現在ではむずかしい。将来的にはそうなるかもしれませんが。

想像力と創造力がなければ、数字は単なる数字に終わってしまう。その通りだと思いました。
素晴らしい事を言っています。テクノロジーは、天から降ってきた魔法のツールじゃない。人が創っているんですから。

“「統計学のアート」と名付けたのは、データ分析が純粋に科学的な「自動化」ではない、ということを示すため”
この連載について
AIやDXが叫ばれ、デジタル庁も創設される中で、企業のデジタルシフトは最高潮に達している。だが実のところ、多くのデータ経営は、身近なスプレッドシートでできてしまう。「本当のデータ思考」をレポートする。