76、統計とは(統計を考える)


比較、比べる



データ分析の基本、鉄則は、比較、照合である。要するに比べる事である。
肝心なのは、何と何を比べるのか。有体に言えば、全体と部分、部分と部分、自と他、前と後である。
何を見るのか。違いと変化である。

統計は、複数の集合を比較する事によって成り立っている。単一の集合では、単なる数の集まりに過ぎない。集合と集合を比較する事ではじめて集合の性格を特定する事が出来る。そして、その比較するという行為が、調査の目的や手段、対象を規定するのである。

データを比較するためには、データの数値化が必要となる。
なぜ数値化する必要があるのか。
数値化する必要性は、数の特性に由来する。数を集めたものは、集合である。数は、任意の属性を抽出し、その特性によって集める事によって数の集まりにしたものをいう。
任意の性格によって要素を調べ、分類し、集める事で集合は成り立っている。この集合の特性そのものが統計の性格を規定している。

つまり、対象を比較するためには、一定の要素を共有する必要がある。任意の性格によって対象を特定するという働きは、数によって成立したのか、調べるという働きによって成立したのか判然としない。ただ、数の共通項によって成り立ているという事実によって統計の基本が確立された事だけは確かである。
次に任意の共通した性格で対象を集め数を数えるという行為が、統計を成り立たせている。その上で、更に何らかの性格を付け加える事によって対象を分類し(集合を分割し)、対象を比べる事が可能となる。

何と何を比較するのか。それは統計の基本を構築する。何を何を基準に比較する。
例えば、過去と現在。国と国。全体と部分。指標と実態。予算と実績等が一般に用いられている。
何と何を比較するかは、目的によって決まる。故に、統計は合目的だと言われるのである。

統計は、何と何を比較するかによってその実質的目的は特定される。
名目的目的だけでは、統計の目的は実現できない。実際に何と何を対象とするかによって統計の目的は達成される。
逆にいえば、比較する対象を間違えると名目的目的と実質的目的は一致しないくなり、統計の有効性は失われる。

特に、部分から全体を想定するという事は、統計の基本である。
何を目的変数とするか、何を説明変数とするかを明確にしておかないと調査や推定の手段は確定しない。

比較という行為で重要な手段、概念の一つに介入がある。
介入というのは、何も操作していない時の結果と何らかの操作、行為を付け加えた上での結果を比較する事で、付け加えた行為、操作の働きを検証する手法である。
介入も統計の基本的手段の一つである。

最近、ビックデータが流行りだが、ビックデータというのは、データの規模ばかりを指しているわけではない。
ピッ生データの中には、データの扱っていいる対象の量などによるものもある。

いつ、何に対し、どこを、誰が、どの様な手段によって調べるのか。
全数調査をすべきなのか、標本調査をすべきなのか。

統計の効用は、複数のデータの集合をいかに組み合わせるかにある。データの組み合わせによって統計の結果は左右される。そして、適正にデータを組み合わせるためには、目的と前提条件との整合性が重要な鍵を握っている。
データがあるから活用するのではなく。目的があってはじめてデータは活用できるのである。
統計は、データそのものが一つの体系を持っているのである。

集合は、数列や分布に置き換えられることで効用を発揮する。また、複数の集合と組み合わせる事が可能になる。
問題は、どの様な条件によって集合を数列化するか、分布化するかである。





ベイズ統計
確率と統計
確率と統計(教育)



参照
「道具としてのベイズ統計」 涌井良幸著 日本実業出版


       

このホームページはリンク・フリーです
ページの著作権は全て制作者の小谷野敬一郎に属しますので、一切の無断転載を禁じます。
The Copyright of these webpages including all the tables, figures and pictures belongs the author, Keiichirou Koyano.Don't reproduce any copyright withiout permission of the author.Thanks.

Copyright(C) 2018.9.1 Keiichirou Koyano