辻元法務事務所の経済勉強会のサイトです。今のところ何のためのサイトか模索中ですが、誰かのお役に立てば幸いです。
データ分析には平均値は必須ですが、その平均値は経営判断にマッチするものなのか、平均値の全容を掘り下げてみましょう。
平均値というのは、N個のデータがあった場合、全部の数値を足し合わせてNで割った値のことで、調査データの代表値としての利用が期待されます。しかし、平均値と言われると、ついつい「ちょうど真ん中の数値」と思ってしまいますが、実はそうではないのです。
※平均値はある一部のデータが押し上げている可能性があると考える!
統計学には、「真ん中あたり」を表す尺度として、@平均値の他にA中央値、B最頻値などがあります。
中央値:全部のデータを小さい順に並べたときに、その真ん中にくるデータの値のことです。15人のテスト結果を点数が低い順に並べたとき、8人目のテストの点数が中央値です。
最頻値:全部のデータを並べたときに、最も頻繁に出現する値のことです。クラスのテスト結果を並べたとき、80点の人が5人で一番多ければそれが最頻値です。
統計データの多くは、左右対称で平均値と中央値と最頻値が一致する正規分布と、分布が大きく偏っていて平均値があまり意味をもたないロングテール型に分かれます。
適正な値を取得するコツは、最初に正規分布かロングテールかを見極めることです。平均値を見ただけで物事を判断するのはとてもリスキーです。
平均値を全体の代表値として捉えてしまうとビジネスの打ち手が上手くはまらないことがあります。細部まではいいので、普段から分布を可視化して眺める習慣をつけておきましょう。