相関関係が因果関係を意味しない理由-統計におけるこの一般的なことわざの意味

あなたはあなたの統計学のクラスからこの単純なマントラを覚えているかもしれません:

「相関関係は因果関係を意味するものではありません。」

だから多分あなたはこのフレーズが何を意味するか知っていると思うでしょう。

たとえば、統計学で一生懸命勉強し、成績が良く、大学に入学した場合、統計学のクラスに参加したために大学に入学したことを意味しているに違いありません。

その成績は、あなたが学んだスキルとともに、おそらく助けになりましたが、他の要素を無視することはできません-そして、あなたの統計学の成績が大学への入学の原因であったと主張することはできません。

まず最初に-なぜ因果関係との相関を間違えるのですか?

2つのことが関連しているように見えるからといって、一方が他方の原因であるに違いないと考えるのは簡単です。しかし、それは愚かで時には危険な仮定になる可能性があります。

たとえば、人々の不機嫌さを軽減する理由を理解しようとしているとします。あなたは、人々が夜に少なくともx時間の睡眠をとると、不機嫌になることが少なくなることを発見した研究を行います。

しかし、ここではすべての要素を考慮に入れましたか?おそらく彼らはまた、よく休んだ結果としてより多くの運動を始めました、そしてこれは彼らの気分を変えたものです。

すべての例がそれほど良性であるとは限りません-そしていくつかはまったく無意味です。

相関関係が因果関係を意味すると仮定することがどれほど誤解を招く可能性があるかを説明するために、タイラー・ヴィゲンの偽の相関関係からの次のグラフを見てください。

これら2つの要因の間には強い相関関係がありますが、一方が他方を引き起こしたと効果的に主張できるとは思えません。おそらく、これは人々が試して証明するための挑戦になるでしょう。

タイラーのコレクションからの別の宝石は次のとおりです。

その美しい相関関係を見てください。しかし、誰かがチーズをもっと食べたからといって、彼らはベッドシーツに致命的に巻き込まれる可能性が高いと主張するのは難しいでしょう。

統計における相関とは何ですか?

辞書によると、相関関係とは、2つ以上のもの(または変数)間の相互関係または接続です。特に、偶然だけでは予期されないものです。

それを一文で使ってみましょう。私の自家製トマトの巨大なサイズは、この夏の余分な雨と相関しているようです。

さて、ここでは、いつもより少し雨が多かったので、私のトマトはナッツになってモンスタートマトを作ったと思います。

しかし、それが唯一の要因ですか?上げ床で使用した栄養豊富な堆肥はどうですか?苗床から購入した植物の品質はどうですか?私の慎重な剪定と世話はどうですか?

ご覧のとおり、私の大きなトマトと雨の夏の間には相関関係がありますが、これは必ずしも因果関係を意味するものではありません。

統計における因果関係とは何ですか?

別の定義の時間です。辞書によると、因果関係は効果を生み出す行為または機関です。

もう少し具体的に見てみましょう。原因とは、一方のイベントが他方に影響を与える2つのイベント間に関係があることを意味します。統計では、別のイベントまたは変数が原因でイベント(または変数)の値が上下する場合、因果関係があったと言えます。Aが原因でBが発生しました。

これの例はどうですか?おそらくあなたは言葉で支払う雑誌のフリーランスです。ストーリーが長いほど(そしてストーリーに含まれる単語が多いほど)、より多くの報酬が支払われます。

したがって、あなたが書く単語の数とあなたが支払われる金額の間には直接的な相関関係があります。しかし、因果関係もあります(あなたがより多くを書いたので、あなたはより多くの報酬を得ました)。

なぜこれを間違えるのがとても簡単なのですか?

相関関係因果関係を意味すると考えるのはなぜそんなに簡単なのですか?ええと、2つのことが関連しているように見える場合、私たちはそれらを関連付けて、それらが互いに影響し合うと想定する傾向があります。天気が寒いとき、人々はより多くの時間を室内で過ごします。休日の前後には、ショッピングモールがいっぱいです。イブプロフェンを服用すると、頭痛がなくなります。

これらの状況は確かに関連しており、因果関係を示唆するものもありますが、必ずしも科学的分析に耐えられるとは限りません。

相関関係から因果関係を誤って推測する理由はいくつかあります。

交絡変数とは何ですか?

まず第一に、交絡変数が混在している可能性があります。これは、関係の独立変数と従属変数の両方に影響を与える変数であるため、その関係の性質を判断する能力を混乱させます。

たとえば、新しい家族が近所に引っ越して犯罪が増えた場合、その地域の住民はそれがその新しい家族のせいであると考えるかもしれません。しかし、同時に、拘置所が近くに開設された場合はどうなるでしょうか。それが犯罪増加の原因である可能性が高いです。

逆因果律とは何ですか?

第二に、あなたは逆因果関係を扱っているかもしれません。これは、AがBを引き起こすと正しく想定する代わりに、それらを混同してBがAを引き起こすと想定した場合に発生します。

これがどのように起こるか想像するのは難しいかもしれませんが、ソーラーパネルがどのように機能するかを考えてください。太陽が空に長くあるとき、それらはより多くの力を生み出します。

しかし、パネルがより多くの電力を生成しているため、太陽は空に長くはありません。太陽が長時間輝くため、パネルはより多くの電力を生成しています。

偶然とは何ですか?

第三に、偶然の力を忘れてはなりません。2つのことが同時に起こった場合、因果関係を見たくなります。しかし、上記のばかげたグラフのように、アーケードとCS度を使用すると、多くは単なる偶然です。

結局、なぜ私たちは気にするのですか?

おそらくあなたは、特定の新薬が患者の気分を良くするかどうかを理解しようとしているのでしょう。または、人々が特定の製品を購入する理由を知りたいと思います。

あなたの動機が何であれ、AがBを引き起こすかどうか、そしてその方法と理由を理解することはしばしば非常に役に立ちます。

しかし、これまで見てきたように、それはそれほど簡単ではありません。できるだけ多くの要因を制御し、変数や偶然の交絡の可能性を減らし、データを関連するものに切り詰める必要があります。

どうすれば本当に因果関係を確立できるのかという、より深い哲学的問題に疑いなく立ち入ることはありません。それはまた別の機会です。

少なくとも今では、2つのイベントまたは変数が関連しているように見える場合でも、一方が他方に直接的な因果関係を持っていることを意味するわけではないことを知っています。