משתנה עזר

מתוך ויקיפדיה, האנציקלופדיה החופשית

בסטטיסטיקה ובעיקר באקונומטריקה, המתודה של משתנה עזר נועדה לאפשר מדידת סיבתיות כאשר ניסוי מבוקר אינו אפשרי ויש חשש של אנדוגניות של אחד המשתנים.

דוגמה[עריכת קוד מקור | עריכה]

נחשוב על מודל ליניארי המנסה לאמוד את השפעת העישון על הבריאות, ובפרט על תוחלת החיים:

כך ש-y הוא מספר השנים שחי הפרט, x הוא כמות הסיגריות שהפרט מעשן בחודש ו- הוא השגיאה. מכיוון שלעישון יש קורלציה עם התנהגויות לא בריאות אחרות. נקבל כתוצאה אפקט חזק מהאפקט האמיתי.

לכן עלינו לעשות ניסוי מבוקר בו נורה לאנשים לעשן מספר מסוים של סיגריות וכך נוכל לבודד את האפקט. מחקר כזה אינו אתי ויקר מאוד. כך שעלינו למצוא פתרון אחר.

כדי לבודד את האפקט זה עלינו למצוא משתנה שלישי, z, שמתואם עם y רק דרך x. אם גובה המיסים על הטבק מתואם שלילית עם כמות העישון ואם החוקר משתכנע שגובה המיסים לא משפיע על אורך החיים בדרך אחרת, אז גובה המיסים על הטבק הוא משתנה תקף.

שיטת האמידה[עריכת קוד מקור | עריכה]

ניתן לחשוב על משתנה עזר כרגרסיה דו שלבית. בשלב הראשון נאמוד את המודל:

הביטוי

הוא אותו חלק בx שאינו מתואם עם הטעות, שכן הוא פונקציה ליניארית של z שאינו מתואם עם הטעות