血液型を当てる方法の計算方法です。実は、この計算の間に数回の間違いをしました(検算のたびに数字が違うのです)。ですから、もし間違いを見つけた場合は教えていただけると幸いです。(^^;;
では本題に入りましょう。まず、次のような仮定をすることにします。 差が30%の特徴がある、つまり、
血液型の当て方は、このようにします。
この方法で血液型が当たる正解率を計算することにします。まず、A型の特徴に該当し、他の血液型の特徴に該当しない確率PA(A)を計算してみましょう。もし、仮にある人がA型だったとすると、この確率は、
PA(A)=(A型の特徴に該当する確率)×(O型の特徴に該当しない確率)×(B型の特徴に該当しない確率)×(AB型の特徴に該当しない確率)×(全体に占めるA型の割合)
=0.8×0.5×0.5×0.5×0.381=0.0381
では、仮にある人がO型だったとすると、この確率PA(O)は、
PA(O)=(A型の特徴に該当する確率)×(O型の特徴に該当しない確率)×(B型の特徴に該当しない確率)×(AB型の特徴に該当しない確率)×(全体に占めるA型の割合)
=0.5×0.2×0.5×0.5×0.307=0.007675
同じようにして、B型のPA(B)=0.00545、AB型のPA(AB)=0.00235となります。ですから、この場合の正解率PAは、
PA=PA(A)/(PA(A)+PA(O)+PA(B)+PA(AB))
=0.0381/(0.0381+0.007675+0.0535+0.0235)=0.0381/0.053575≒0.711
つまり、このことは5.36%の確率で起こり、この場合の正解率は71.1%です。同じ方法でPO≒0.639(起こる確率は4.80%)、PB≒0.527(起こる確率は4.14%)、PAB≒0.293(起こる確率は3.21%)になります。つまり、「ある血液型の特徴に該当がある場合で、他の血液型の該当がない場合」の全体の正解率P1(起こる確率は17.5%)は、
P1=0.1/0.175≒0.571
P1の血液型分布を調べると、A:O:B:AB=38.1:30.7:21.8:9.4となり、元の分布と一致します。となると、「ある血液型の特徴に該当がある場合で、他の血液型の該当がない場合」以外の場合も、A:O:B:AB=38.1:30.7:21.8:9.4となりますから、A型と答えると38.1%の確率で当たることになります。そこで、全体の正解率PALLは、
PALL=(P1の正解率)×(P1が起こる確率)+(P1以外の正解率)×(P1が起こらない確率)
=0.571×0.175+0.381×(1−0.175)≒0.417
つまり、41.7%の正解率ということになります。同様に、差が25%の特徴があるとすると、該当率は75%と50%ですから、
ある血液型の該当率が75%、他の血液型の該当率が50%という特徴が血液型別に1つずつある
として計算してみると、全体の正解率PALLは、
PALL=0.5×0.188+0.381×(1−0.188)≒0.406
更に、該当率を70%と50%としてみると、全体の正解率PALLは、
PALL=0.438×0.2+0.381×(1−0.2)≒0.395
となります。黙ってA型と答えても38.1%は当たるのですから、1つの特徴では41.7%(特徴の差が30%)、40.6%(特徴の差が25%)、39.5%(特徴の差が20%)となり、ほとんど当たらないことがわかります。これには困りました。(*_*)
特徴の数が2つ以上の場合は、更に計算が面倒になるので省略します。(^^;; 知りたい人もいないでしょうし…。
上の計算は、特徴に当てはまるかどうかを「はい」「いいえ」の2つに分けるデジタル的な方法でしたが、当てはまる率を0〜1までアナログ的に評価するという方法に変えるともっと当たるのです! この場合、1つの特徴をそのまま使うのではなく、いくつかの特徴を組み合わせて新たな特徴を計算するという方法も可能です。もちろん、血液型の当て方は、一番当てはまる率が高い血液型と断定することとします。
では、ある血液型の該当率(他の血液型の該当率は50%)が80%、75%、70%と同じ正解率にするには、差がどのぐらい必要か計算してみましょう。この場合、結果が0〜1までにどんな分布をするのかですが、「常識的」に正規分布になるものと仮定します。そこで、標準偏差σはどの程度になるのかが問題となりますが、他の例を見ると0.2ぐらいのようです。0.5が平均とすると、正規分布では0〜1の間に98.8%のデータが入りますから、まあ妥当な数字でしょう。
では話を最初に戻しましょう。「ある血液型の該当率が80%、他の血液型の該当率が50%という特徴」にしないといけません。分布はこのようになるものとします。
そこで、平均がどの程度違うと該当率が80%以上になるのか調べてみると、0.84σ以上ならいいことがわかります。標準偏差が0.2ですから、0.2×0.84=0.168程度の差でいいことになります。つまり、アナログ的な方法だと、たった?16.8%の差でいいことになります。同じ方法で、該当率が75%だと13.4%(=0.68σ)の差、70%だと10.4%(=0.52σ)の差でいいことになります。
10〜20%程度の差がある特徴なんてゴロゴロしていますから、うまく使えばかなりの人の血液型を当てることも可能なようです。ただし、この計算はあくまで理論値ですので、誰でも簡単にこんなに当たるというわけではありません(笑)。
以上は、特徴が1つの場合でしたが、2つ以上の場合は具体的にはどんな方法で判断するのかという問題が残ります。2つの特徴の合計を計算するという方法もありますが、実はよく分かりません(苦笑)。その他にはウェイト付けもありますが、どんなウェイトを付けるのかが問題です。これは、後日の検討課題にしたいと思います。