サンプリングの謎
サンプリングは、日常普通に使われます。
たとえば、ヒトの身長の平均を求めたいときは、ランダムにサンプルを抽出、それの算術平均で計算します。これは誰も疑問に思いません。
しかし、ちょっと待ってください。平均の定義は、サンプル値にその確率をかけて、サンプル数で足し合わせたものですね。
ここに乖離があるわけですが、これはモンテカルロ法でサンプルした状況と同じです。つまり、サンプリングするということは、ある確率密度から抽出するので、すでに確率が考慮されているということです。
このあたり、初歩的な確率・統計本では、きちんと説明がされていないような気がします。気のせいかな?
たとえば、ヒトの身長の平均を求めたいときは、ランダムにサンプルを抽出、それの算術平均で計算します。これは誰も疑問に思いません。
しかし、ちょっと待ってください。平均の定義は、サンプル値にその確率をかけて、サンプル数で足し合わせたものですね。
ここに乖離があるわけですが、これはモンテカルロ法でサンプルした状況と同じです。つまり、サンプリングするということは、ある確率密度から抽出するので、すでに確率が考慮されているということです。
このあたり、初歩的な確率・統計本では、きちんと説明がされていないような気がします。気のせいかな?
スポンサーサイト
コメントの投稿
No title
標本平均と期待値を混同されてはいませんか?
トンチンカンなことを申していたらご容赦ください.
トンチンカンなことを申していたらご容赦ください.
No title
コメントありがとうございます。明日の記事のネタにさせていただきます。