帰納推論結果の合成が必要な例
例1) ?の数値は?
1 0 1 0 1
1 1 0 1 0
1 0 1 0 1
1 1 0 1 0
? 0 0 0 0
前提:?(不明)は0:50%、1:50%と仮定してよい。
さまざまな条件で一般帰納法で推論します。
①全体を集合にした場合
集合内分布 1:12/25、0:12/25、?:1/25
推論結果 1:50%、0:50%
不偏平均絶対偏差:0.50
②左端の列だけを集合にした場合
集合内分布 1:4/5、?:1/5
推論結果 1:90%、0:10%
不偏平均絶対偏差:0.18
③下端の行だけを集合にした場合
集合内分布 0:4/5、?:1/5
推論結果 0:90%、1:10%
不偏平均絶対偏差:0.18
②と③は対称なので不偏平均絶対偏差も同じです。
回答としては、②と③のどちらも最適解になります。
最終的な回答選択肢としては、0と1は半々になります。
データの0と1が対称なので、直感的にも妥当です。
例2) ?の数値は?
1 0 1 0 1 0 1
1 1 0 1 0 1 0
1 0 1 0 1 0 1
1 1 0 1 0 1 0
? 0 0 0 0 0 0
縦に並んだ1より、横に並んだ0の方が多いです。
③下端の行だけを集合にした場合
集合内分布 0:6/7、?:1/7
推論結果 0:13/14、1:1/14
不偏平均絶対偏差:0.13
①②は例1と同様です。
最適解は不偏平均絶対偏差が最小の③です。
最終的な回答に②が全く影響しません。
13/14もの確率で、0が出ると推測します。
この回答は、直感的な回答と合いません。
縦に並んだ1と横に並んだ0の個数が、全く同じでなくても、同数に近づくほど、50%ずつに近づくはずです。
僅かな差で結果が大きく変わってしまうと、ノイズに大きく影響されてしまいます。
原理的にも、近いデータなら近い結果になるはずです。
この問題は、推論結果の合成をすることで解決されます。
上記の最適解とは、合成をしなかった場合の最適解です。
帰納推論結果の合成法
(1)推論対象のみの不偏絶対平均偏差を求める
推論対象のみのを集合とした場合です。
「不明」の不偏絶対平均偏差です。
(2)各推論の不偏絶対平均偏差を求める
(3)不偏絶対平均偏差の減少量を求める
各推論について、(2)-(1)を計算。
(4)推論対象とそれ以外を別の集合に分ける
各推論について行います。
(5)減少量(3)を推論対象以外の元に均等に割り振る
各推論について行います。
(6)各推論の集合を0~1の重みで採用する
推論対象の元は重み1で採用します。
採用された元の減少量(3)の合計を最小化します。
推論対象の元の減少量(3)は0です。
合成しなければ、元の減少量(3)の合計は(2)と同じです。
複数の推論が同じ元を持つとき、減少量(3)は最小値を見ます。
全く同じ推論結果を合成しても、変わりません。
採用は、元単位ではなく、集合単位で行います。
減少量が同じ集合は、同じ採用率にします。
減少量が同じなのに、採用率に差があってはいけません。
減少率が悪いものが優先で採用されることもありません。
コメント