76、統計とは(統計を考える)


正規分布は基準となる分布である。


正規分布というのは、ある意味で純粋に数学的問題である。それを現実の問題と取り違える重大な錯誤を犯す事になる。

正規分布は一般にどこでもあるとか、一番数多くあるとか言われているが、実際の現象で正規分布になる事象はめったにない。
正規分布になるというのではなく、正規分布に当てはめた方がいろいろと使い勝手がいいというだけの事である。
正規分布は、分析したり検討する際の基準となる分布として最適だとは言える。それが正規分布の意義であって正規分布がそこら中に存在するという意味でもなく、そこら中に存在する必要もないのである。

正規分布というのは、母集団の基準となる形を持っている。なぜならば、正規分布は、平均と分散を基にして設定された形だからである。
分布の形を表す基準として平均値、中央値、頻度、偏差値などがある。
正規分布は平均値、中央値、頻度が一体となっており、これが重要な意味を持っている。

正規分布になる現象というのは一般には稀である。滅多にない。
ところが、一般の現象に正規分布が多くあるとしている教科書すらある。
ただ、正規分布は実際の分布を測る基準としては極めて有効である。
また、確率分布においても正規分布を想定する事は一般に行われている。

記述統計でいう分布と確率分布との区分を付けずに記述統計の分布にも確率分布でも同じように有効だとする教科書が見受けられる。正規分布は万能なのではない。正規分布は特定の目的に活用すると有効なのである。
根拠もなく多くの入門書があたかも統計や確率のあらゆる現象の根底に正規分布があるかのような記述をしている。
そして、一般に正規分布になる現象が多くあると決めつける。
そのうえで、いきなりサイコロの話になる。これでは、初心者は、記述統計における分布と確率分布との区別がつかなくなる。それが確率や統計を一般にわかりにくくしている最大の原因である。

日本語で正規分布と訳されている事が誤解の原因にもなっている。正規分布の正規は、英語では、normalとされる。normalという意味には、正規という以外に、標準の、規定の、正常の、常態の、一般並みの、平均の、正常な発達をしている、垂直のという意味がある。

正規分布は、基準となる分布として有効である。ただ、何が何でも正規分布という訳にはいかない。
正規分布は、平均値、中央値、最頻値が一体となった分布である。この平均値、中央値、最頻値が一体な分布には、正規分布以外に二項分布などがある。ただ、平均値、中央値、最頻値が一致しない一般に分布もあり、その歪みを測定するためにも、正規分布を活用できる。ただ、正規分布を万能だと考えるのは短絡的である。
分布というのは、あくまでも想定であり、目的や状況に合わせて任意に設定すべきものなのである。

確率や統計に用いられる分布は、決まった形があるわけではない。統計など、むしろ不規則な形をしているのが常である。
ところが、統計や確率の勉強を始めるといきなり正規分布とは何か。分散や偏差とは何かから教えられる。その時点で統計が理解できなくなったり、嫌いになったりする者が続出する。学校を出ても、統計はどうも敬遠されてしまう。
それは、我々が日常、目にしている統計とは、掛け離れたものに感じるからである。

統計というのは、経済統計にせよ、アンケート調査にせよ不規則で、見た目には出鱈目なものに見える。
しかし、だからこそ面白いし、何らかの規則性や法則性を見つけ出せたらわくわくする。
ただそれをひたすら眺めていると何らかの傾向や兆候、あるいは、変更が見えてくる。分析というのは、そこから始まる。
統計というのは、本来、そのようなものである。正規分布は、分析にあたって一つの枠組みを提供してくれる。
ただ、基本的にはそれだけである。枠組みに嵌めて考えれば法則性や規則性が成り立ちしやすい。
だから、正規分布を使うのである。
正規分布というのは、原理でも真理、法則でもない。そういう絶対的なものではないのである。
だからテレビのむクイズ番組にも取り上げられるのであり、それ程面白いものなのである。
それを今の統計に対する教育は興ざめさせてしまう。







       

このホームページはリンク・フリーです
ページの著作権は全て制作者の小谷野敬一郎に属しますので、一切の無断転載を禁じます。
The Copyright of these webpages including all the tables, figures and pictures belongs the author, Keiichirou Koyano.Don't reproduce any copyright withiout permission of the author.Thanks.

Copyright(C) 2017.7.18 Keiichirou Koyano