76、統計とは(統計を考える)


ビックデータとベーズ統計



ビックデータが成立するのは、ベース統計があるからである。
少なくともベーズ的なアルゴリズムがなければビックデータは成立しなかったと思われる。

ビックデータというのは、全数調査という意味とは異なっている。
ビックデータというのは、単に大量なデータ群、データの塊というだけではなく。種々雑多とか、多種類のという意味もある。大体、ビックデータに対して何らかのこれだという定義があるわけではない。
それなのに、ビックデータというと全数調査と勘違いしている人が結構いる。
そういう人の多くは、全数調査にこだわる傾向があるように思われる。
全数調査は、統計の究極的な姿という訳ではない。
可能だからと言って全数調査をしなければならないという訳ではない。

ビルゲイツがベイズ統計がマイクロソフトの基本戦略はベイズ統計だと言った。
ただ、ベイズ統計か、頻度主義かという議論になるとしたら不幸な事である。

ベイズ統計を排斥した事が問題なのであり、ベイズ統計を絶対視するのは本末転倒である。

ベイズ統計によるか、他の手法によるかは、分析家の考えや目的によるのである。
その点を勘違いしてはならない。

ビックデータがベイズ統計に基づくというのは、ビックデータの性格による。
ビックデータは一般に、日々、データが蓄積されていくものが多い。
つまり、データの多くは完結していないのである。
完結せずに常に結果を更新していくことに意義がある場合が多い。
故に、ビルゲイツは、マイクロソフトの基本戦略として位置づけられたのである。



ベイズ統計
確率と統計
確率と統計(教育)



参照
「道具としてのベイズ統計」 涌井良幸著 日本実業出版


       

このホームページはリンク・フリーです
ページの著作権は全て制作者の小谷野敬一郎に属しますので、一切の無断転載を禁じます。
The Copyright of these webpages including all the tables, figures and pictures belongs the author, Keiichirou Koyano.Don't reproduce any copyright withiout permission of the author.Thanks.

Copyright(C) 2018.9.7 Keiichirou Koyano