【疑問1】を解決する「計算式」とは
全体の平均も、基準はサンプルの平均値である412分です。そして、ここからどれくらいまで離れた中に入っている可能性があるか、を考えます。それが次の式です。
1.96×(サンプルの標準偏差/√(サンプル数))
ここで唐突に「1.96」という数字が出てきましたが、これについてはかなり高度な数学を要しますので、別の機会でお話しすることにしましょう。
「サンプルの標準偏差」と「サンプル数」はわかりますね。それぞれ、45.50と900です。
そして、この式はどんな背景から出てきたのか疑問に思う人もいるでしょう。
これについてはかなり込み入った統計学の話になってしまい、本書の本来の目的である「ビジネスで使える」という趣旨からだいぶ逸れてしまいます。ですので、本書では深入りはせずに、使い方だけお伝えすることにしておきたいと思います。
この式に「サンプルの標準偏差」と「サンプル数」を当てはめてみましょう。すると、
1.96×(45.5/√900)
となります。√900とは、2乗して900になる数のことでした。30×30=900なので、√900=30です。つまり、
1.96×(45.5/30)
となり、これを計算すると、約2.97分という結果になります。およそ3分です。
これは、「全体の睡眠時間の平均値は、サンプルの平均値である412分からプラスマイナス3分の誤差の範囲の中にある」ことを意味しています。
つまり、今回のアンケート調査から、日本全体の30代から50代の睡眠時間の平均値は、「おそらく409(412-3)分から415(412+3)分の間にある」というように結論づけられるわけです。これで先ほどの【疑問1】が解決されました。これだけ狭い範囲まで限定できるのは、ある意味すごいですよね。これが統計学の力です。
鈴木 伸介
株式会社数学アカデミー 代表取締役