帰納推論結果の合成

帰納推論結果の合成が必要な例

例1) ?の数値は?
1 0 1 0 1
1 1 0 1 0
1 0 1 0 1
1 1 0 1 0
? 0 0 0 0
前提:?(不明)は0:50%、1:50%と仮定してよい。

さまざまな条件で一般帰納法で推論します。

①全体を集合にした場合
集合内分布 1:12/25、0:12/25、?:1/25
推論結果  1:50%、0:50%
不偏平均絶対偏差:0.50

②左端の列だけを集合にした場合
集合内分布 1:4/5、?:1/5
推論結果  1:90%、0:10%
不偏平均絶対偏差:0.18

③下端の行だけを集合にした場合
集合内分布 0:4/5、?:1/5
推論結果  0:90%、1:10%
不偏平均絶対偏差:0.18

②と③は対称なので不偏平均絶対偏差も同じです。
回答としては、②と③のどちらも最適解になります。
最終的な回答選択肢としては、0と1は半々になります。

データの0と1が対称なので、直感的にも妥当です。

例2) ?の数値は?
1 0 1 0 1 0 1
1 1 0 1 0 1 0
1 0 1 0 1 0 1
1 1 0 1 0 1 0
? 0 0 0 0 0 0

縦に並んだ1より、横に並んだ0の方が多いです。

③下端の行だけを集合にした場合
集合内分布 0:6/7、?:1/7
推論結果  0:13/14、1:1/14
不偏平均絶対偏差:0.13

①②は例1と同様です。

最適解は不偏平均絶対偏差が最小の③です。
最終的な回答に②が全く影響しません。
13/14もの確率で、0が出ると推測します。

この回答は、直感的な回答と合いません。
縦に並んだ1と横に並んだ0の個数が、全く同じでなくても、同数に近づくほど、50%ずつに近づくはずです。
僅かな差で結果が大きく変わってしまうと、ノイズに大きく影響されてしまいます。
原理的にも、近いデータなら近い結果になるはずです。

この問題は、推論結果の合成をすることで解決されます。
上記の最適解とは、合成をしなかった場合の最適解です。

帰納推論結果の合成法

(1)推論対象のみの不偏絶対平均偏差を求める
 推論対象のみのを集合とした場合です。
 「不明」の不偏絶対平均偏差です。

(2)各推論の不偏絶対平均偏差を求める

(3)不偏絶対平均偏差の減少量を求める
 各推論について、(2)-(1)を計算。

(4)推論対象とそれ以外を別の集合に分ける
 各推論について行います。

(5)減少量(3)を推論対象以外の元に均等に割り振る
 各推論について行います。
 
(6)各推論の集合を0~1の重みで採用する
 推論対象の元は重み1で採用します。
 採用された元の減少量(3)の合計を最小化します。
 推論対象の元の減少量(3)は0です。

合成しなければ、元の減少量(3)の合計は(2)と同じです。

複数の推論が同じ元を持つとき、減少量(3)は最小値を見ます。

全く同じ推論結果を合成しても、変わりません。

採用は、元単位ではなく、集合単位で行います。
減少量が同じ集合は、同じ採用率にします。
減少量が同じなのに、採用率に差があってはいけません。
減少率が悪いものが優先で採用されることもありません。

コメント

タイトルとURLをコピーしました