未分類

読了『「それ、根拠あるの?」と言わせない データ・統計分析ができる本』柏木 吉基

統計の本を読むのは初めてでしたが、正直こんなに分かりやすいものとは思いませんでした。

この本で書かれているデータ分析に用いる方法はたったの5つです。おおざっぱに書きます。

平均(AVERAGE)…ある複数のデータの平均です。みんな知ってますね。

中央値(MEDIAN)…ある複数のデータの真ん中の値です。平均とは違います。

標準偏差(STDEV】…あるデータについて、平均からどのくらい離れているかもしくは離れる可能性があるかを示します。学校の偏差値なんかがコレですね。

相関分析(CORREL)…ある2つのデータの比例・反比例関係を表します。2つのデータの関係の強さが分かります。

単回帰分析(近似曲線、R-2乗値)…ある一方のデータが動いた時に、他方のデータがどのくらい動くのかがわかります。相関分析で関係性があると分かっていることが前提です。

これらの分析を上手に使うため、序章に目的と仮説の立て方、終章に分析結果の見せ方が解説されています。分析は手段であって目標でないという著者のスタンスが随所から感じられます。

本書の良いところはビジネスでの使用を前提としている所です。

新規市場開拓のための役員へのプレゼンをするためにデータ分析をすることになった新人君が上司に分析を教わる…というのが本書のストーリーですが、こういう話、よくあるんじゃないでしょうか?

データ分析の流れですが、以下のようになります。

  1. 目的を設定(新規市場への参入計画を役員に提示し、GOサインをもらう)
  2. 目的達成に必要と思われる仮説を設定(新規市場の規模を算出する)
  3. 仮説に必要なデータを探しだすまたは作り出す(データを「比率」に直す等)
  4. データから平均を算出し、中央値との差を見て使える値か判断する(平均を元に規模を算出)
  5. 標準偏差を使い、平均からどの程度バラつく可能性があるかを算出する(バラつきが大きいほど、4で算出した規模が+-する可能性がある)
  6. 相関分析で有効な方法を探し出す(購買数増加に直結する広告方法は何か)
  7. 単回帰分析でより有効な方法を比較する(テレビCMとチラシならどちらが費用対効果が高いのか)
  8. 分析結果が仮説と目的に合致しているか確認する。
  9. 目的に沿った内容に分析結果をまとめ、わかりやすく提示する。

こうしてみると9が一番疲れる所かも知れませんね。答えの無いところですし。

この点はTED等のセンス良いプレゼンを参考に自分なりに頑張るしかないと思います。

僕のこの記事なんかより本の内容の方がよっぽど分かりやすいので、統計や分析に興味がある方はぜひ読んでみてください。

タイトルとURLをコピーしました