新着Pick
5126Picks
Pick に失敗しました

人気 Picker
エクセルで十分いろんなことができるという意見に賛成です。

一方で、関数も多すぎてグラフも多機能過ぎて、結局何をしたら良いか分からないという人も多いと思います。

そんな方にオススメなのがこちら。
統計学大百科事典 仕事で使う公式・定理・ルール113
https://www.amazon.co.jp/dp/4798162809/

分かりやすくまとめられていて、読んでいるだけでも楽しく勉強になる。そして読みながら「あ、俺の仕事の○○はこの手法で分析すると!」みたいなインスパイアが生まれる。それから関数をググれば、やり方は簡単にわかります。

そして、以下は本当に大切なことだと思います。特に②は常に意識していないと、数字遊びになってしまいますから。
①データで何ができるのかを理解する
②適切な課題設定、それに必要なデータを使う

人事の方にはこちらもオススメ。
人事のためのデータサイエンス
https://www.amazon.co.jp/dp/4502266310/
この記事を補足するとしたら、
・プログラミング言語Pythonはやっぱり学びたい。ちゃんとしたテキストを使い、TAに助けを得ながら学習すると数十時間でとりあえずのところまで習得できます。
・線形代数(統計はすでに書いてあるので)
があると良いと思います。

なんと言えばいいか、スプレッドシートやタブローで非常に多くのことができるのですが、結構すぐにできることに限界を感じてきてしまいます(言っていることが矛盾していますが)。もしくは、ExcelもGoogle SpreadsheetもVBAやGASができると幅が広がるかもしれません。

Pythonの勉強はGoogle ColabなどWEBサービス、もしくはWindowsでもMacでもフリーのツールがあるので簡単に始められます。

C言語とかDelphiとかしかなくて、コンパイラがそもそも数万円していた時代を考えると隔世の感がありますね。昔はそもそもパソコンも20万円くらいからでしたね。
データ分析で課題設定が意外と難しいというのはリアルな話ですね。ある程度のケースをつまないと思考が鍛えられないのかもしれません。データの意味を理解して価値を生み出すがデータサイエンスのおもしろさですね。

"もう1つ意識すべきなのは、適切な課題設定をすることです。当たり前に聞こえるかもしれませんが、これが意外と難しい。〜たとえば、競馬でデータを使った予測をするとします。このとき、「どの馬が勝つか」と「どの馬券を買ったら儲かるのか」は、似ていますが異なる課題ですよね。"
「適切な課題設定と、それに必要なデータにフォーカスする」というポイント、とても納得します。実際にGoogleの人事分析プロジェクトでこんな事例がありました。

候補者の採用体験向上のため、面接中に不適切な対応をした面接官がいないか、またそれをどう面接官本人にフィードバックすべきか…という趣旨のプロジェクトだったのですが、論点になったのは候補者から面接官へのフィードバックを"いつ"取るか。採用プロセス進行中だとポジティブな意見しか返ってきませんでした。じゃあ採用結果が出たあとなら…ということになりますが、時間が空いてしまうと候補者も面接官全員のことを覚えていないのではないか?と今度はデータの信憑性への不安が浮上します。
そこで、(覚えていて)フィードバックを残したい面接官のみを候補者に"選択させる"という提案をしました。
「でもそれだと面接官全員分のフィードバックが集まらなくて、データ量が減ってしまうよ」と指摘されましたが、
「候補者は"とても良い体験"と"とても悪い体験"こそ覚えていて、フィードバックしたがるでしょう。印象に残らなかった面接官の分までフィードバックデータを集める必要はありません。大事なのは"良い面接官"の特定と称賛、そして"悪い面接官"の特定と育成であるべきです。それさえ達成できれば、データ量にこだわる必要はないと思います」と説得し、運用化しました。現在でも、全社のcandidate experience surveyに組み込まれ運用されていると聞きます。

何事も、「得られたデータで何を達成したいのか」から逆算してデータ収集/分析をすることが勝ち筋だと思います。
暑い夏は家にこもってデータサイエンスしましょう
「データを持っているだけでは意味がない」という点と「適切な課題設定が必要」という点は、とても同意できます。

何かで読んだ話ですが、やたらとデータをため込んでいる会社が少なからずあるようです。

「そのデータ、どのように使うのですか?」
と訊ねると、
「一応、持っておこうと思って」
という回答が返って来るという、笑えない話でした。
一歩一歩...まさに、手をとって、導いてもらえる感じの、すばらしい指南書です。

私の周囲にも「なんとか理解したいけど、どう始めてよいかわからない」という人も少なくないので、この内容を共有したいと思います。

※個人的な見解であり、所属する会社、組織とは全く関係ありません
データサイエンス、どこから入門すればいいか全く分からない。そもそも自分の仕事に役立つの? 要らなくない?と逃げようとしている人(私です)にこそ、読んでほしい。

どんなものなのか覗いてみる最初のステップが簡単で、自分の仕事にどう活用できるかイメージがわきます。
データの活用は一種のトレンドみたくなってますが、ビッグデータ、データマイニングは、何でも見つけれそうな気がしてしまい、少し期待の過剰反応があるようにします。分析にあたって面白い仮説を見つけるための手段ではあるけれども、結局、最後は多くの仮説を立てて順に検証していく方が切れ味のイイものが出てくるように思います。

もちろん、データ分析が使えれば鬼に金棒ですけどね。
今は動画配信などで、安く簡単に統計分析を学べます。グラフの種類も多く、可視化することによって、データの特性が理解しやすい。

このレポートを読んで、もう一度基礎から学び直したいと思いました。
この連載について
リモートワークやオンライン授業が普及しつつあり、ビジネスパーソンや学生はリアルな場で、対面で、学ぶ機会が減っている。これからは自宅で、独力で、オンラインツールなどを使い、勉強していかなくてはならない。今後、求められる知識やスキル、マインドセットは何か。それをどうやって獲得するか。「新しい自己啓発」を紹介していく。