有料コンテンツの購読
現在、Web上での有料コンテンツ購読機能は準備中です。
ご不便をおかけしますが、有料コンテンツを購読希望の方は
モバイルアプリ上で購読の手続きを行ってください
認証方法を選んでください
ご協力いただきありがとうございます。
いただいた情報は実名認証のみに使用いたします。
利用可能になる機能
コメントの公開範囲が
すべてのユーザーまで開放されます
フォロー中トピックスの投稿にコメント・返信ができるようになります
Facebookで認証を行う
LinkedInで認証を行う
名刺・学生証で認証を行う
お名前の変更には
再度実名認証が必要です
Facebookで認証を行う
LinkedInで認証を行う
名刺・学生証で認証を行う
名刺または学生証を利用して
実名認証を行いましょう
名刺または学生証をアップロード
※ 名刺等の情報は照合にのみ利用します
※ アップロードされた資料は公開されません
入力された情報に虚偽があった場合、認証が取り消されることがあります。
これに同意の上、下記のチェックボックスにチェックして登録を完了してください。
実名認証を行う
を利用して
実名認証を行いましょう
入力された情報に虚偽があった場合、認証が取り消されることがあります。
これに同意の上、下記のチェックボックスにチェックして登録を完了してください。
実名認証を行う
実名認証が完了しました
ご協力いただきありがとうございました。
一層のコミュニティ活性化に取り組んで参ります。引き続きNewsPicksをご活用ください。
利用をつづける
実名認証をして
コメントを発信しよう
現在あなたのコメント公開範囲は
フォロワーのみに限定されています
信頼性の高いコメントコミュニティをつくっていくために、実名認証にご協力をお願いします。設定を行うことでコメントの公開範囲が「すべての利用ユーザー」に開放されます。
実名認証を行う
あとで
学割プラン継続確認
学割プランは毎年4月に更新の確認を行っております。
4月以降も学割プランを継続されたい方は、
学生情報を更新してください。
学生情報を更新されない場合、
次回更新時に自動解約となります。
卒業される方等、プレミアムプランに移行される方には
1ヶ月無料期間をサービスいたします。
学割プランを更新されない場合
学生の場合
学生の間であれば、またいつでも学割プランにお申込み頂けます。
社会人になる場合
いま、アンケートに答えてプレミアムプランに移行すると1ヶ月無料の特典が受けられます。
ここで「更新しない」を選択すると、後からは1ヶ月無料の特典は受けられなくなりますのでご注意ください。
メール認証をしてください
ご登録いただいたメールアドレス宛に届くメールから
URLをクリックし本人確認をお願い致します。
届いてない場合、見つからない場合は下記から再送と認証をお願い致します。
再送設定する
閉じる
Open an app
Download an app
Close
パンデミックという現象を、さまざまな角度の数字で分析は大きな前進だった一方で、怪しいデータもたくさん登場し、インフォデミックという言葉も取りざたされました。
今回取材した統計学の権威であるシュピーゲルホルター氏は「データリテラシーは現代の必須スキル」だと言います。
とはいえ、それを身につけるためには、統計学の難しい公式や、データサイエンスのアルゴリズムが必要だという話ではありません。むしろ、データから、何かを学ぶためには「アート」が必要であり、それを実現するための、データサイクルというものがあるのだと指摘しています。
今や欧米で引っ張りだこのシュピーゲルホルター氏への直撃取材から、ぜひ新たなデータへの気付きを得ていただければ幸いです。
例えば、「〇〇の薬が効いた」、「うがい液が効果がある」、「△△をすると、◇◇になる確率が〇%高まる」・・・といった表現が、残念ながら世にあふれていますが、こういったことは、かなりの数の被験者について、前提を正しく設定して、精緻な比較試験を行い、その生データに必要な統計学的調整などを加えた上で、はじめて言えることです。
例えば、薬の有効性は、大規模な治験を行い、当該疾患を有する患者さんを、その薬を投与するグループと、プラセボ(偽薬)又は標準的な薬を投与するグループとに分けて、統計的に優位な差があるか、ということを証明して、はじめて言えることです。
また、「たばこを吸うと◇◇病になるリスクが〇%高まる」という話は、多数の人間を長期間観察し、喫煙以外の要因(年齢、食事や運動などの日常生活、既往症等々の違い)の影響を取り除く複雑な調整等をして、はじめて分かることです。
ですから、新型コロナ禍で、国民的関心の高いこうした事項について、責任ある立場にあるはずの方々から、データ分析や統計の知見をお持ちとは思えない、無責任なあるいは過度に楽観的な「見解」が飛び出す度に、この国は、だいじょうぶかいな・・・、と心配になります。
ちなみに、わたくしは、厚労省に入って仕事をする中で、政策立案の前提となるデータの提示のされ方に「ん?これを鵜呑みにしちゃ、いけないんじゃないか?」と疑問を抱き、根拠に基づく政策立案・客観的な説明をきちんと行えるようになろうと、留学して「パブリックヘルス」を学びました。
自分は知らないことばかりだと、今も常に思う日々です。
昨日の記事でもコメントしましたが、今日の記事の例であれば、100人中6人なのか7人なのかの違いを「2割多い」というところだけを強調して伝えるのが良いのかはケースバイケース
また、仮にこれが有意に相関していたとしても、例えばベーコンを食べる人、というのが何らかの属性を表していた場合は(豊かな人は食べる、逆に貧しい人は食べる、最近の人は食べる、特定の人種は食べるなど)、そちらが真因かもしれない、という昨日もあった相関≠因果という問題もあります
また、教科書的には「仮説なく分析してはいけない」と言われますが、いろいろな軸をとってみてそこから仮説が生まれることも往々にしてあって、記事の例だと死亡場所と死因(コロナ)にフラグ立てをしてグラフ化したから見えてくる仮説もあるのは実務的な感覚ともよく合います
データと、そこからのメッセージ(データからの解釈、仮説をサポートするためのデータという位置づけ)は違う。現実としては、メッセージはPPDCAのProblem・Plan・Dataを行き来して試行錯誤をしながら、決めていったり精度を上げるもの。その行き来から見るデータとメッセージを決めるのはアートそのものだと思っている。
人間は、経験という定性理解からこれをめちゃくちゃ効率的にできる。将棋や囲碁で、機械がものすごいエネルギーを使っているのに対してトップ棋士の消費エネルギーは普通の食事で、ものすごく効率的。これは経験という大局観から考えることを極めて絞り込んでいるから(計算の物量では、もう数十年前から計算機の方が強い)。
だから、下記のワークマンにあったようなどんなにがんばっても「当たり前の結論」になりがち。ただそこでも書いたが、それが出るようになったことはすごい進化だし、そこに早くたどりつけると、これまでは定性理解だった多くのことが定量説明もつき、そしてそれをもとに議論をできる企業は強いと思う。そこにExcelを使おうがAIを使おうが手段の話で貴賤はなく、「目的に対して適切なツールを適切に使えるか」が全て。
https://newspicks.com/news/5295098
【保存版】データは、こうして「視覚化」せよ
https://newspicks.com/news/5281306
データをうまく視覚化する秘訣はいきなりチャートを作らない、誰のためになにを伝えるのか具体的なメッセージを作ることから、とお伝えしました。
そのメッセージは、本記事に書かれているデータありきで何か言えそうなことを語るのではなく、問題や目的を明確にしてデータサイクルをまわしながら見つけていくものだと思います。
昨日の記事にすこし疑問を持たれた方、もっと深掘りたい方、チャートを見る側のリテラシーを知りたい方などなど、ぜひ、合わせてお読みいただけるとうれしいです!
本文にも出ている通り、数学や統計が真実に近づくために重要なツールであることは間違いないですが、世の中の大多数は、裏側にある手法には興味も理解も無く、抽出されたメッセージだけを見て解釈する、というのが現実です。
そういう意味で、「そもそも、この話をしている人の動機は何なのか?」ということだけは常に頭に入れておく、というのは誰でも取り組める現実的な提案だなと感じました。教師無し機械学習でもない限り、分析には誰かしらの意図・バイアスが必ず入っているはずです。
“「統計学のアート」と名付けたのは、データ分析が純粋に科学的な「自動化」ではない、ということを示すため”
想像力と創造力がなければ、数字は単なる数字に終わってしまう。その通りだと思いました。
このシリーズ通してデータの可視化に注目しているわけですが、それ自体が重要なことは否定しません。ただ、統計学やコンピュータサイエンスを用いたデータ分析はビジネス目的では3種類があります。
①可視化(過去に何が起こったか?)
②予測(未来に何が起こるか?)
③最適化(未来に何をすべきか?)
①に寄るほど統計学の知識が、②③に進んでいくほど機械学習系の知識が必要になってきます。この方、統計学の専門家なので①のことしか語っていません。かつ、可視化結果からネクストアクションを考えるのではなく現状把握に使っているだけです。①②の結果を使って人間がどのようにネクストアクションを決めるのか、③の結果を使ってネクストアクションをどのように自動化するのかがビジネス的には重要であって、現状の把握で終わってしまっては何もビジネスは前に進みません。
> 私は「統計学のアート」と言い続けているのです。これは単なるツールのセットではありませんから。
シュピーゲルホルター氏の『統計学はアート』という言葉は印象に残ります。
弊社はDXを取り組むプロフェッショナルの一つとしてデータサイエンティストを育成しています。
データサイエンティストは、記事でもある通り、データの背景を深く理解し、そこからストーリーとしてなにかしらの示唆を導き出し、それを表現することが求められます。お客様の業務を深く理解し、ストーリーとして語れるデータサイエンティストを今後も伸ばして参りたいと思います。