AERA 2020年5月18日号で、『BCGとコロナ 高まる相関関係』という記事が掲載され、大きな波紋をよんでいます。
まず、脳科学者の茂木健一氏。
たいへん興味深いデータです。予防医学の大切さを改めて感じるとともに、人体というものの複雑さ、奥行きを教えられます。
— 茂木健一郎 (@kenichiromogi) May 14, 2020
BCG有無でコロナ死亡率「1800倍差」の衝撃 日本や台湾で死者少ない「非常に強い相関」〈AERA〉https://t.co/FAH6VdEHx1
そして、タレントでもあり、何かと政治や国際時事問題にも意見するフィフィさん。
BCG有無でコロナ死亡率「1800倍差」の衝撃 日本や台湾で死者少ない「非常に強い相関」〈AERA〉
— フィフィ (@FIFI_Egypt) May 14, 2020
結核の予防接種「BCG」の接種の有無で、新型コロナの死亡率に大きな差が見られた。中でも、日本から広がった「日本株」という株を接種している国の死亡率が極めて低い。https://t.co/A0isQz3DOf
個人的に、いろいろ刺激を受けている永江氏。
BCG有無でコロナ死亡率「1800倍差」の衝撃 日本や台湾で死者少ない「非常に強い相関」〈AERA〉(AERA dot.) – Yahoo!ニュース https://t.co/Uwc4cLWnYf
— Isseki Nagae/永江一石@「虎の穴」 (@Isseki3) May 15, 2020
ま、こんな感じです。
で、このAERAの元記事を読んで思ったことは・・・
『うーん・・・。これ、相関関係があるって言えるのかなぁ・・・』
ええ、もちろん、私は、医学は専門ではありません。感染症なんて、よく分かってません。
でも、IT業界で長く情報を扱ってきた直感が、『なんか、おかしいぞ?』って囁くのですw
そこで、私なりの『新説・コロナ感染と国名の関係』について、説明したいと思います!w
まず、AERAに掲載されていたグラフを表にしてみました。
国名 | 100万人あたりの感染者数 | 100万人あたりの死者数 |
イラン | 1226 | 77 |
トルコ | 1579 | 43 |
台湾 | 19 | 0.3 |
イラク | 63 | 2.6 |
日本 | 120 | 4.4 |
韓国 | 211 | 5 |
中国 | 58 | 3.2 |
ポルトガル | 2560 | 106 |
ノルウェー | 1483 | 40 |
イギリス | 2978 | 445 |
フランス | 2675 | 396 |
ドイツ | 2014 | 87 |
オーストラリア | 273 | 3.8 |
スウェーデン | 2383 | 293 |
スペイン | 5428 | 553 |
イタリア | 3541 | 490 |
アメリカ | 3837 | 337 |
さて、ここで、『新説・コロナ感染と国名の関係』を調べるために、それぞれの国の名前を漢字を調べてみます。
国名 | 漢字名 | 100万人あたりの感染者数 | 100万人あたりの死者数 |
イラン | 伊朗 | 1226 | 77 |
トルコ | 土耳古 | 1579 | 43 |
台湾 | 中華民国 | 19 | 0.3 |
イラク | 伊拉克 | 63 | 2.6 |
日本 | 日本 | 120 | 4.4 |
韓国 | 大韓民国 | 211 | 5 |
中国 | 中華人民共和国 | 58 | 3.2 |
ポルトガル | 葡萄牙 | 2560 | 106 |
ノルウェー | 諾威 | 1483 | 40 |
イギリス | 英吉利 | 2978 | 445 |
フランス | 仏蘭西 | 2675 | 396 |
ドイツ | 独逸 | 2014 | 87 |
オーストラリア | 濠太剌利 | 273 | 3.8 |
スウェーデン | 瑞典 | 2383 | 293 |
スペイン | 西班牙 | 5428 | 553 |
イタリア | 伊太利亜 | 3541 | 490 |
アメリカ | 亜米利加 | 3837 | 337 |
そして、ここからが、この新説のキモになるのですが(?)、エクセルシートで、漢字名でソート(降順に並べ替え)をやってみると・・・・
ほら!! 漢字表記の国名でソートすると新型コロナ感染も下に行くほど小さくなります!
もちろん、綺麗にはならびません。多少の誤差は、ありますが、それって、最初のBCGのグラフだって同じ。
BCG有無でコロナ死亡率「1800倍差」の衝撃 日本や台湾で死者少ない「非常に強い相関」 https://t.co/ZZSiJ5jW3Y #AERAdot #AERA
— AERA dot. (アエラドット) (@dot_asahi_pub) May 13, 2020
まだ、理由は分かりませんが、言葉は『言霊』と言われるように、その音の響きや、漢字そのものが持つ意味によって『魔除け』や『結界』を作ることと関連しているのかもしれません!!
なーんてなことが言えるようになりますwww
これ、おちゃらけで、やってみましたが、人工知能を使って相関関係を分析するのって、一歩間違うとこういうことをやってしまいます。
大量のデータを入れることで、相関関係を導き出すのが人工知能なのですが、偶然、そうなっているのか、本当に何らかの関連性があるのかは、人間には理解できません。
未来予測と言っても、すべて過去のデータから導き出されたものであって、本当に相関関係があるのかどうかなど、はっきりとは分かりません。
どういう理由、理屈でそういう相関関係が出てくるのかは、人間の思考からすれば、『最初に仮説ありき』なので、仮説に基づいて、それをただしいかどうかという証拠(エビデンス)を集めます。
確かに、理由があって、相関関係が見いだせるものもありますが、その反証も見つかるのも科学では、出てきます。
その反証があってこそ、より精度の高いモデルが発見されて、予測が正確になっていきます。
何が言いたいのかというと、人工知能は、あくまでも『過去のデータに限定した相関関係』を見出すことしかできず、『仮説』すら作れません。
ましてや、その相関関係が、今後も通用するかどうかなんて、まったく分からない状態です。
一方、技術革新は、恐ろしいほどの速さで進んでいるので、計測データは、日々、とんでもない量になっていきます。
そう、ますます、データ全体を見て相関関係を見出すのは、人工知能でないとできないような量になっていくのです。
その結果、人間は、人工知能がはじき出した『相関関係』に悩まされるだけで、なんとなく関係ありそうだよなぁ・・・ぐらいしか分からず、その理由も分からないままになっていきます。
まあ、そういう世の中になり、理解するなんていうのは、程遠く、なんとなく、そうなんだろうなぁぐらいで、みんな行動するようになっていくのかもしれないですよw