Assoc. Prof. Hasep


ABO FAN


Pencil_and_Paper32.gif (245 バイト)長谷川芳典さんの論文

 最近、長谷川芳典さん(現・岡山大学文学部心理学教室)の論文を読む機会があったので、ここに紹介させていただきます。議論ではずいぶんとお世話になりました。この場を借りて深くお礼申し上げます。m(._.)m

 ここで、長谷川さんのURLをお知らせしておきます。

 このページで取り上げた論文の一部についての紹介がされています。-- H11.8.15

09.gif (441 バイト)論文1

 原題: 「血液型と性格」についての非科学的俗説を否定する 日本教育心理学会第27回総会[東京都千代田区・国立教育会館] S60

 残念ながら、この論文は入手することができませんでした。しかし、松田薫さんの改訂第二版『「血液型と性格」の社会史』(360ページ)に『長崎新聞』の記事があり、そのデータが一部紹介されています。それによると、受験生など881人を調べた結果、次のようなデータが得られたそうです。

  1. 「A型は試験の時など上がってしまい、ふだんの実力を出せないことがある」といわれているが、「A型は」の項目を削って質問したら、当たっていると○をした人はA型で24.5%、他の型(B、O、AB型)が36.9%
  2. O型といわれる「好き嫌いがはっきりしている」では、O型の人58.1%、他の型65.6%が当たっていると答えている

 この2つについてχ−検定をしてみたところ、1については危険率0.1%以下で有意(χ値13.89)、2については危険率は5%以下(χ値4.16)で有意となります。つまり、この差は偶然ではなく、血液型によって差があることになるようです。しかし、記事中で長谷川さんは「血液型での性格判断は同じような行動、特徴を(言葉)を変えて言っているだけで、その形容はどの血液型にもあてはまる」と述べています。χ−検定の結果はどうなるのでしょうか? はて?

 ただし、881人というのは次の論文2でのYG性格検査(調査2)のサンプル数のようです。となると、このケースは論文1ではなく論文2の血液型と性格特性(調査1)ということになります。どちらが本当なのかは、この記事を読んだだけでは判断できません。
 仮に、論文2の血液型と性格特性(調査1)のものだとすると、サンプル数は133人ということなります。この場合は有意差はありませんが、通常この程度のサンプル数では有意差は出ないので、特に不思議はないと思います。 -- H11.8.15

09.gif (441 バイト)論文2

 原題:  血液型と性格 ―公開講座受講生が収集したデータに基づく俗説の検討 長崎大学医療技術短期大学部紀要 第1巻 77〜89ページ S63

 この論文には、4つの調査が公開されています。下にYG性格検査(調査2)の一部について掲載しておきます(81〜82ページ)。

Table 4には、性格類型の比率を一般市民と学生に分けて血液型別に示した。性格類型の人数分布が血液型によって異なるかどうかについてχ検定を行ったところ、一般市民、学生のいずれにおいても有意な差は認められなかった(一般市民χ=9.09, p>.50; 学生χ=13.80, p>.25)

Table 4 血液型別の性格類型の比率

YG性格検査に基づいて分類した性格類型の人数分布を血液型別に示す。各類型には、典型・準型・亜型を含む。

社会人全体(男45名、女84名)

血液型・性格類型 A類 B類 C類 D類 E類
A型者 9 9 7 23 3
B型者 2 4 3 16 2
O型者 5 5 11 15 3
AB型者 3 2 3 3 1

学生全体(男543名、女209名)

血液型・性格類型 A類 B類 C類 D類 E類
A型者 68 46 57 46 68
B型者 45 31 34 36 36
O型者 53 29 53 37 36
AB型者 13 14 13 12 25

  なるほど!ですね。

 ところで、社会人全体のデータを見てみると、D類が多くてE類が少ないように見受けられます。しかし、「一般市民、学生のいずれにおいても有意な差は認められなかった」のはなぜでしょうか? 実は、サンプル数が少ないので、この割合が偶然かどうかはわからないのです。つまり、本当に差がある可能性もあるのです…。残念!

 さて、学生全体のデータについては、AB型にE類が多いように思えます。そこで、E類とそれ以外に分けてχ−検定をしてみたところ、危険率は2%以下(χ値8.70)となりました。つまり、「有意な差」が認められたことになります。なぜ論文に書かなかったのでしょうか? はて?

 閑話休題。

 血液型とは直接関係ありませんが、社会人全体と学生全体の表を比べてみると面白いことがわかります。血液型による差よりも、社会人と学生という立場・年齢による差の方が大きいのです。あるいは、社会人は女性が多く、学生は男性が多いので、この差は性別によるものかもしれません。
 私がデータを分析した経験では、坂元章さんの論文でもほぼ同じ傾向が見られます。こちらも、血液型による差より、年齢や性別による差の方が大きいのです。血液型と性格を分析するには、サンプルや分析方法について、細かくチェックする必要があるのかもしれません。 -- H11.8.15

 次に、少人数の血液型分布に対する主観的評価(調査4)の一部について掲載しておきます(84〜85ページ)。

長崎大学公開講座を受講した一般市民の一部30名に、パソコン(PC−9801VM2)を用いて、大きさが10、20、30、40、50名であるよう架空の「血液型分布標本」を20個ずつ作成した。…このようにして作られた20×5=100通りの血液型分布のそれぞれについて平均的な血液型分布と比較して偏っていると思うか、それとも偶然的な変動の範囲内にあると思うのかを回答させた。

Table 6 「偏りがある」と判断された比率が20%、30%、40%、50%以上であった架空の血液型分布標本の数血液型別の性格類型の比率

標本の総数はそれぞれ20。いずれもコンピュータの乱数に基づいて行われた。

標本の大きさ・比率 20%以上 30%以上 40%以上 50%以上
10名 16 7 4 3
20名 13 10 6 4
30名 18 14 10 6
40名 16 10 5 2
50名 19 17 10 4

 なお、各血液型の割合については、日本人平均となるように考慮してありますし、回答者にもその割合は知らせてあります。長谷川さんの結論としては、

 このようにして作られた20×5=100通りの血液型分布のそれぞれについて,日本人の偶然的な変動の範囲内にあるはずの血液型分布標本に対して,かなりの回答者が「偏りがある」との主観的判断を示した.今回「抽出」した標本はコンピュータが生成した乱数に基づくものであり,日本人全体から無作為に抽出した標本と何ら変わらないはずである.しかしながら,各20個の標本のうち大部分に対しては回答者の20%以上が「偏りがある」と判断し,さらに2〜6個の標本に対しては半数以上が「偏りがある」と判断している.これらの結果は,少人数の標本に対しては見かけ上のちょっとした変動でも何か意味があるかのように受け取られがちであることを示している.
 各標本についての形式的なχの値と「偏りがある」と判断した回答者の比率には高い相関があった.このことは,基本的には,回答者が「χ検定的な」判断をする力をもっていることを示すものである.主観的判断における過誤は,回答者の設定する「危険率」が大きすぎることに起因しているように思う.

 実は、この結論には若干の疑問があります。まず、下の表を見てください(服部環・海保博之著 『Q&A心理データ解析』 福村出版 H8.2 92ページ)

コラム4−6 「相関が0.062でも関係あり!!」

 標本数が多くなると、わずかな差でも、統計的には有意という結果が得られやすいくなります。たとえば、下の表は、ピアソンの相関がどれくらいなら5%水準で有意か(母相関は0でない)を、標本数と対応させて示したものです。標本数1000にもなると、わずかに0.062でも有意となります。…

標本数 相関係数
5 0.878
10 0.632
50 0.279
100 0.195
500 0.088
1000 0.062

 これはχ−検定でも同じことです。逆に言うと、サンプル数が少なければ、本来は関係がある(はずの)データでも、「関係ない」とされてしまうわけです。

#ちなみに、χ−検定では、差が同じだとするとχ値はサンプル数に比例します。

 ところで、統計的検定には、第一種の過誤と第二種の過誤があります。第一種の過誤とは、帰無仮説が正しい(=血液型と性格は関係ない)場合に、これを正しくない(=血液型と性格は関係ある)としてしまう誤りです。第二種の過誤とは、帰無仮説が正しくない場合(=血液型と性格は関係ある)に、これを正しくない(=血液型と性格は関係ない)としてしまう誤りです。読むとわかるように、長谷川さんの説明は第一種の過誤についてだけで、第二種の過誤についての説明がありません。

 ところが、血液型の場合は回答率の差は高々10〜20%ですから、数百名以上のサンプル数がないと有意な差にならないケースが多いのです。だから、今回のようにサンプル数が50名以下の場合には、どの場合でも第二種の過誤の方が大きくなる…はずです。つまり、この論文を読む限り、一般の人は「血液型と性格には差があるにもかかわらず、差がない」と誤ってしまう確率が高いように思えてしかたがないのですが…。

 そういえば、Table 6では偶然としては「偏りがある」と判断された比率が高いようです。なぜでしょうか? そこで、再度「血液型分布標本」の作成方法について読んでみると、

 パソコン(日本電気製PC-9801VM2)を用いて,大きさが10,20,30,40,50名であるよう架空の「血液型分布標本」を20個ずつ作成した。まず,標本の大きさ分だけRND関数によって0以上1未満の乱数を生成させる.この乱数の値が0.381未満の時はA型者,0.381以上0.599未満のときはB型者,0.599以上0.906未満の時はO型者,0.906以上の時はAB型者が1名抽出されたものと見なし,人数をカウントしていく.これによって,A型者38.1%,B型者21.8%,O型者30.7%,AB型者9.4%の確率で抽出された架空の血液型分布標本ができあがる.

 このPC-9801VM2とパソコンは私も使ったことがありますが、RND関数というのだからマイクロソフトのN88-BASICを使っているようですね。実は、昔のマイクソフトのBASICにあるRND関数には癖があるらしいのです。今となっては出典すっかり忘れてしまいましたが、散布図等で分析をした結果、この関数は乱数としては不適当である、という指摘をパソコン雑誌の記事で見たような記憶があります。ただし、機種がPC-9801VM2だったかどうかは定かではありません。となると、「コンピュータが生成した乱数に基づくものであり,日本人全体から無作為に抽出した標本と何ら変わらないはず」のではなく、「コンピュータが生成した乱数だから、日本人全体から無作為に抽出した標本と違う」ことにもなりかねません。

 そして、結果のデータを見る限り、このRND関数には癖があるように思えます。だから、こんなに「偏りがある」と判断された比率が高いのかも…。生のデータがないので真実は不明ですが…。別なマシンでもう一度やってみるといいのでしょうか? はて?  -- H11.8.22


ホームページへ


最終更新日:平成11年8月22日