数学入門: 第14章フィードバック

「ライブ講義大学1年生のための数学入門」を使った学生・読者の反応と, それに対する著者からのフィードバックです。

ポイント

統計学においては得られたデータをそれぞれ確率変数とみなす一方で、確率分布は未知であるものとし、誤差を標準偏差として扱う。

標本サイズは標本の中に含まれている標本データのことであり、標本数は母集団内の部分集合としての標本の数である。

確率論と統計学の違い: 確率論は「分布」の理論を作る。それを元に, 統計学は「データ」から「分布」を推定する。

質問

偏差値はどうして10倍して50を足さなければいけないのでしょうか?

数学的・統計学的には合理性や必然性はありません。偏差値を作った人が, こうすれば多くの人にわかりやすいんじゃね? と, 主観的に思ったというのが実情でしょう。なぜそう思ったかは, 追求しても仕方ない問題だと思いますが, あえて考えるなら, 標準偏差はマイナスの値をとるけど, 小中学生でまだマイナスに慣れていない子どもや, 数学が苦手な保護者たちに配慮して, なるべくマイナスにならないようにした。同様の理由で, なるべく整数で表されるようにした（ぴったり整数にはなりにくいけど, 上2桁だけ取り出して整数にすることで有効数字的には十分）。というところではないでしょうか。

標本標準偏差は母集団の分散の代用として考えられたということだろうか。

母集団の標準誤差の代用です。

統計学における「推定できる」という言葉は、「十分量のデータがあれば近似することができる」という解釈でよいのだろうか。

そういうことです。

学生のリアクションペーパーから

標本データどうしが独立であるときを考える。母集団から標本データを選ぶ選び方はさまざまあるため、標本平均は標本の選び方によって異なる。それによって結果もさまざまにばらつく。このばらつきを表現したものが標準誤差(標本平均の標準偏差)であり、母集団の標準偏差を$\sqrt{n}$で割ることで求められる ($n$は標本サイズ)。ただし、母集団の標準偏差は未知であることが多いため、標本標準偏差で代用することが多い。「標本平均の標準偏差」とはいうものの、標本平均のデータ数が1であっても求めることができる。これは本当にすごい。標本平均の誤差を$(1/A)$倍にしたいときは標本サイズを$A^2$倍にすれば良い。「標本データどうしが独立である」という前提はこの話の中で最も重要なポイントである。

このブログを検索

奈佐原顕郎の読者フィードバック