Shiran.Tips

מתאם (קורלציה) לעומת סיבתיות

December 01, 2019 | 1 Minute Read

databias#

והפעם - צריכת המרגרינה גורמת לעליה בשיעור הגירושים, האומנם?!

מה בין מתאם לסיבתיות?
צריכה להיות הבחנה ברורה בין מתאם (קורלציה) לסיבתיות.

מתאם הוא תכונה של קשר סטטיסטי בין שני משתנים. עוצמת הקשר נמדדת על ידי ״מקדם המתאם״ ונעה בסולם ערכים של בין 1- ל-1 (כאשר מקדם המתאם שווה ל0 נגיד שאין קשר בין המשתנים, וכאשר הוא שווה ל1 או 1- נגיד כי בין המשתנים קיים קשר מלא.

לעתים קרובות, כאשר שני אירועים מתרחשים יחד (קיים מתאם מלא בין המשתנים), נתפתה לחשוב שהאחד גרם לשני. אך מתאם (קורלציה) אינו מעיד בהכרח על סיבתיות.פעמים רבות מדובר בצירוף מקרים או שקיים גורם שלישי הגורם לשני ההשפעות גם יחד.

לדוגמה,

כאשר ישנה עליה ניכרת במקרי השריפות, נצפת עליה דומה במכירות הגלידה. האם ניתן להסיק מכך ששריפות גורמות למכירות גלידה? לא! הסיבה ל-2 התופעות היא העליה בטמפרטורות. בחודשי הקיץ החמים הסבירות למקרי שריפות עולה כמו גם מכירות הגלידה, ללא קשר ביניהם.

דוגמה נוספת,

הטמפרטורות העולמיות עלו בהתמדה במהלך 150 השנים האחרונות ומספר הפיראטים צנח בקצב דומה. איש לא יטען באופן סביר כי הירידה בפיראטים גרמה להתחממות כדור הארץ או שיותר פיראטים ישיבו אותה. אלא, הגורם לשניהם הוא התיעוש.

בקישור הבא תוכלו למצוא מקרים רבים (והזויים) של דברים בעלי מתאם מלא, וללא קשר סיבתי כלל: https://www.tylervigen.com/spurious-correlations

אז האם צריכת המרגרינה גורמת לעליה בשיעור הגירושים? אם נסתכל על הנתונים ב-2 המקרים, נראה מתאם של 99% לאורך השנים בין שיעור הגירושים בMaine לבין שיעור צריכת המרגרינה, אך זכרו - אין להניח סיבתיות בגלל מתאם בלבד, יש לאסוף תמיד ראיות נוספות!

Photo by Jude Infantini

רוצה להשאר מעודכנ/ת?

* שדה חובה