76、統計とは(統計を考える)


分散は、母集団の性格を測る尺度である。


分散は、母集団を構成する要素の散らばり具合を言う。分散を表す尺度としては偏差がある。
偏差とは、代表値から母集団を構成する要素への距離を意味する。代表値で一般的なのは、平均値であり。平均との距離を偏差という。分散は、偏差によって平均値の距離に還元する事で、平準化される。

一般に自然現象における分散は、誤差の問題として考えられている。誤差というとらえ方だけでは、分散の待つ働きをとらえきれない。
分散を誤差とするか、事実とするかによって結果が違ってくる。アルゴリズムが違ってくる。

これは、経済などの社会現象を扱う場合により顕著になる。

誤差とするか、事実とするかは、分析の目的、対象、そして、データを採取した時の状況によるのである。
試験の点数等は誤差というより事実であるが、偏差値として扱う場合は誤差としてみなしている場合が多い。
それは、正規分布ありきとしているからである。
試験の成績は、あくまでも生徒の序列を明確にすることにあって教育的な目的によるものではない。
故に、試験によって序列さえ明確になればいいのである。

分散の分布は、偏差によって分布が平準化されると中心軸が平均値と中央値と最頻値が一致する。
なぜ、正規分布なのかというと正規分布が平均値と分散によって設定されているからである。
特に標準偏差は、正規分布を前提として考えられている概念であるから、標準偏差を基準にして分析した場合、必然的に正規分布に近似することになる。正規分布というのは近似値に基づいている。
実測値が正規分布する事は稀である。

ただ、実測値を無理やり正規分布に当てはめるのではなく、実測値の歪みや偏りを、偏差値に基づいて導き出された正規分布と比較した方が母集合の性格を明らかにできる。
正規分布というのは基準として有効なのである。全てを正規分布に当てはめようとすると統計や確率の真意は失われる。






ベイズ統計
確率と統計
確率と統計(教育)



参照
「道具としてのベイズ統計」 涌井良幸著 日本実業出版


       

このホームページはリンク・フリーです
ページの著作権は全て制作者の小谷野敬一郎に属しますので、一切の無断転載を禁じます。
The Copyright of these webpages including all the tables, figures and pictures belongs the author, Keiichirou Koyano.Don't reproduce any copyright withiout permission of the author.Thanks.

Copyright(C) 2017.7.18 Keiichirou Koyano