不明の比率によるサイズ効果
帰納推論の元の数は、統計の標本サイズに相当します。
帰納では、推論対象を「不明」値の元として含めます。
集合全体の元の写像の分布が、推測値になります。
推論対象以外の元の数をnとします。
推測値の確率分布の内、1/(n+1)は、「不明」です。
nが増えるほど「不明」の比率が減ります。
「不明」は、どんな値より悪い推測値です。
元の数が増えるほど、推測精度が良くなります。
だんだん、その効果は弱まります。
偏り相殺によるサイズ効果
データには、偏り(バイアス)があるかもしれません。
無作為抽出でも、偏りは発生します。
標本平均と母集団平均には差が生まれます。
その差は、標準誤差と呼ばれます。
n:標本サイズ
標準誤差=標準偏差/n^0.5
nが増えるほど、相殺して偏りが小さくなります。
だんだん、その効果は弱まります。
標準偏差が小さいと標準誤差も小さくなります。
しかし、標準誤差さえ小さければ良いとはいえません。
標本サイズの効果で標準誤差が小さくても、標準偏差が大きければ回答選択肢が絞り込めていません。
推論の良さは、1つの値で表せないと比較できません。
そもそも一般帰納法では、データが母集団から抽出した標本とは仮定していません。
データが母集団の場合でも、標本の場合でも、ケースバイケースで対応できる必要があります。
母集団と標本の差を無視しないなら、母集団を推定した上で、一般帰納法を適用します。
母集団なのか標本なのか分からなければ、母集団と仮定するという条件付きで回答します。
偶然性によるサイズ効果
例)次回のコイントスは表か裏か?
①:表表表表?
②:表表表表表表表表?
偶然でなければ、表しか出ないコインと推測します。
①偶然:0.5^4=1/16、表のみ:1-1/16
②偶然:0.5^8=1/256、表のみ:1-1/256
標本数が増えるほど、偶然の影響が減ります。
だんだん、その効果は弱まります。
ただし、普通は半々の確率で表と裏が出るというのは、勝手に仮定しているだけです。
表でも裏でもない状態も考えられます。
帰納法では、勝手な仮定は不要です。
①表:4/5、不明:1/5
②表:8/9、不明:1/9
ただし、帰納するのは演繹できない場合だけです。
勝手な仮定なしで演繹できる場合は、演繹します。
コメント