世の中の話題が基本的に例のウイルスばかりで、いやでもデータが目につきます。しかし、せっかくのグラフも恣意的に情報がピックアップされたり、これは何のデータですか、サンプル数少なすぎませんか的な、リテラシーが問われるものが多いです。
ぼくはポピュラーサイエンスを嗜む程度に本は読んでいるけれど、データ分析を仕事で使ったことないんです。けれど、テレビやネットを見ていて、ぼくよりできないのにすごいテキトーなことをむちゃくちゃ言ってるなと思うことが頻繁にあるんですね。
なので、ぼくの発言も、ひょっとしてデータ分析では素っ頓狂なことを言ってたんじゃないかと思ってきました。それに、次の仕事はデータをもろに扱うことになると思うので、いつかできないといけなかったデータ分析というものをこの期間に勉強する良い機会だと思い、重い腰を上げることにしました。
考え方は、
FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣
- 作者:ハンス・ロスリング,オーラ・ロスリング,アンナ・ロスリング・ロンランド
- 発売日: 2019/01/11
- メディア: 単行本
上記の本を読んだので、ファクトが大事であるとかRCTをやるんだぞとかは大枠で理解しているのですが、実際に自分がデータを扱うとなると「はて?」と言った感じにります。
というか、数学が昔から全然できないのでそこから始めないといけないのでは?と思ってました。
そしたら、
機械学習の前に
— じゅん@米国人事データサイエンティスト (@4dheHUxEurAEhQg) April 23, 2020
記述統計⇨T検定⇨分散分析⇨単回帰⇨多変量解析の順番で勉強すべき。
これは全部繋がってるし、繋がりを感じながら勉強するべき。
こんなのが流れてきました。
記述統計なんてのは初めて聞きました。記述統計とは得られたデータからその特徴を抜き出すためのテクニックのことのようです。それは重要です。
というわけで、基礎から勉強することにしました。以下の3つの本を買いました。
本書 は、 統計学 の 入門 書 です が、 誤解 を 恐れ ず 大胆 に いう なら、「 これ 以上 何 かを 削っ たら、 統計学 に なら ない」 という ギリギリ の 道具立て と 簡単 さで 書か れ た「 超 入門 書」 です。 本書 は 2 部 構成 と なっ て い ます。 第 1 部 では 初歩 の 初歩 から スタート し ながら も、「 検定」 や「 区間 推定」 という 統計学 の 最 重要 項目 の ゴール に 最短 時間 で 到達 する こと を 目指し ます。
使うのは中学数学だけと謳っていて、自分にはぴったりだと思いました。もう数式はでてきません!って本は何冊か読んだので、自分で手を動かさないといけないと思ったんですが、とにかく数学に苦手意識があるので、超入門書と書いてる本書から始めることにします。
最も効果的な販促策はどれか?結び付きの強さで要因(理由)を見つける(相関)、バラつきからリスクをあぶり出す(標準偏差)、丁度いいデータがないときは?知識ゼロでも今すぐ使える、日産・経営企画マネジャーが教える説得力を増す数字の使い方。必要な手法だけを取り上げ、データを効果的に使うための考え方やノウハウを紹介。
ビジネス実務に近い本という認識。あれ?この程度ならぼくも会社員時代にやってたような…と疑問がでましたが、きちんと理解していたわけでもないのでおさらいの意味も込めて。ほんとは評判が良かったので買いました。
ぼくは中小企業に勤めていて、きちんとしたビジネス資料作成教育を受けていないのでお作法というか、「一般的にはこうですよ」と知りたかったので。
これも評判が良かったので。実務的。
データ分析の準備の本らしい。事前にデータ分析の目的と、その結果からどんなアクションをするのかを明確にしてか分析に入る、その基礎がわかるらしい。
というわけで、統計学入門書1冊と実務書2冊の計3冊を購入しました。
今月、この3冊を読んで基本的なことを理解したいと思います。