קורלציה חלקית

מתוך ויקיפדיה, האנציקלופדיה החופשית

בתורת ההסתברות ובסטטיסטיקה, קורלציה חלקית מודדת את דרגת הקשר בין שני משתנים אקראיים, כאשר ההשפעה של משתנים אקראיים אחרים הוסרה. כאשר מעוניינים לכמת באיזו מידה יש קשר מספרי בין שני משתנים, השימוש במקדם המתאם ביניהם יביא לתוצאות מטעות אם קיים משתנה אחר, מבלבל, הקשור לשני המשתנים. ניתן להימנע ממידע מטעה זה על ידי בקרת המשתנה המבלבל, באמצעות חישוב מקדם המתאם החלקי. מסיבה זו ישנה מוטיבציה לכלול משתנים אחרים בצד ימין ברגרסיה מרובה; אך בעוד רגרסיה מרובה נותנת תוצאות לא מוטות לגודל האפקט, היא לא נותנת ערך מספרי של מדד לחוזק הקשר בין שני המשתנים המעניינים.

לדוגמה, אם יש לנו נתונים כלכליים על הצריכה, ההכנסה והעושר של אנשים שונים ואנחנו רוצים לראות אם יש קשר בין הצריכה להכנסה, אי שליטה על משתנה העושר בעת חישוב מקדם המתאם בין צריכה להכנסה היה נותן תוצאה מטעה, מכיוון שההכנסה עשויה להיות קשורה מספרית למשתנה העושר שבתורו עשוי להיות קשור לצריכה; מתאם מדוד בין צריכה להכנסה עלול להיות מזוהם על ידי מתאם אחר זה. השימוש במתאם חלקי פוטר בעיה זו.

בדומה למקדם המתאם, מקדם המתאם החלקי מקבל ערך בטווח שבין -1 ל-1. הערך -1 מייצג בקרת מתאם שלילית מושלמת עבור כמה משתנים (כלומר, קשר ליניארי מדויק שבו ערכים גבוהים יותר של משתנה אחד קשורים לערכים נמוכים יותר של האחר); הערך 1 מייצג מערכת יחסים ליניארית חיובית מושלמת, והערך 0 משמעותו כי אין קשר ליניארי.

המתאם החלקי עולה בקנה אחד עם המתאם המותנה אם המשתנים האקראיים מתפלגים במשותף כהתפלגות רב-נורמלית, אליפטית, התפלגות היפרגאומטרית, רב-משתנית שלילית(אנ'), היפר-גאומטרית, התפלגות מולטינומית או Dirichlet(אנ'), אך לא באופן כללי[1].

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Kunihiro Baba, Ritei Shibata, Masaaki Sibuya, Partial Correlation and Conditional Correlation as Measures of Conditional Independence, Australian & New Zealand Journal of Statistics 46, 2004, עמ' 657–664 doi: 10.1111/j.1467-842X.2004.00360.x
ערך זה הוא קצרמר בנושא סטטיסטיקה ובנושא מתמטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.