מהו גורם אינפלציית שונות (VIF)?
מהו גורם אינפלציית שונות (VIF)? גורם אינפלציית שונות (VIF) הוא מדד של כמות מולטיקולינאריות בניתוח רגרסיה. ריבוי-קולינאריות קיימת כאשר יש מתאם בין מספר משתנים בלתי תלויים במודל רגרסיה מרובה. זה יכול להשפיע לרעה על תוצאות הגרסיה. לפיכך, גורם האינפלציה השונות יכול להעריך עד כמה השונות של מקדם רגרסיה מנופחת עקב רב-קולינאריות.
מהו גורם אינפלציית שונות (VIF)? – נקודות מרכזיות
הבנת גורם אינפלציה של שונות (VIF)
גורם אינפלציית שונות הוא כלי שיעזור לזהות את מידת הרב-קולינאריות. רגרסיה מרובה משמשת כאשר אדם רוצה לבדוק את ההשפעה של משתנים מרובים על תוצאה מסוימת. המשתנה התלוי הוא התוצאה שעליה פועלים המשתנים הבלתי תלויים – התשומות למודל. רב-קולינאריות קיימת כאשר יש קשר ליניארי, או מתאם, בין אחד או יותר מהמשתנים או התשומות הבלתי תלויים.
בעיית הרב-קולינאריות
רב-קולינאריות יוצרת בעיה במודל הרגרסיה המרובה מכיוון שכל התשומות משפיעות זה על זה. לכן, הם אינם עצמאיים למעשה, וקשה לבדוק עד כמה השילוב של המשתנים הבלתי תלויים משפיע על המשתנה התלוי, או התוצאה, בתוך מודל הרגרסיה.
בעוד שמולטי-קולינאריות אינה מפחיתה את כוח הניבוי הכולל של מודל, היא יכולה לייצר הערכות של מקדמי הרגרסיה שאינם מובהקים סטטיסטית. במובן מסוים, אפשר לחשוב על זה כסוג של ספירה כפולה במודל.
במונחים סטטיסטיים, מודל רגרסיה מרובה שבו קיימת מולטי-קולינאריות גבוהה יקשה על הערכת הקשר בין כל אחד מהמשתנים הבלתי תלויים למשתנה התלוי. במילים אחרות, כאשר שני משתנים בלתי תלויים או יותר קשורים קשר הדוק או מודדים כמעט אותו דבר, אז ההשפעה הבסיסית שהם מודדים נלקחת בחשבון פעמיים (או יותר) על פני המשתנים. כאשר המשתנים הבלתי תלויים קשורים זה לזה, קשה לומר איזה משתנה משפיע על המשתנים התלויים.
שינויים קטנים בנתונים המשמשים או במבנה של משוואת המודל יכולים לייצר שינויים גדולים ולא יציבים במקדמים המשוערים על המשתנים הבלתי תלויים. זו בעיה מכיוון שהמטרה של מודלים אקונומטריים רבים היא לבדוק בדיוק סוג זה של קשר סטטיסטי בין המשתנים הבלתי תלויים למשתנה התלוי.
מבחנים לפתרון מולטי-קולינאריות
כדי להבטיח שהמודל צוין כראוי ומתפקד כהלכה, ישנן בדיקות שניתן להריץ למולקוליניאריות. גורם אינפלציית השונות הוא כלי מדידה כזה. שימוש בגורמי אינפלציה של שונות עוזר לזהות את חומרתן של בעיות מולטי-קולינאריות כלשהן, כך שניתן יהיה להתאים את המודל. גורם אינפלציה של שונות מודד עד כמה ההתנהגות (השונות) של משתנה בלתי תלוי מושפעת, או מנופחת, מהאינטראקציה/המתאם שלו עם המשתנים הבלתי תלויים האחרים.
גורמי אינפלציה של שונות מאפשרים מדידה מהירה של כמה משתנה תורם לטעות הסטנדרטית ברגרסיה. כאשר קיימות בעיות מולטי-קולינאריות משמעותיות, גורם אינפלציית השונות יהיה גדול מאוד עבור המשתנים המעורבים. לאחר זיהוי המשתנים הללו, ניתן להשתמש במספר גישות כדי לבטל או לשלב משתנים קולינאריים, ולפתור את בעיית הרב-קולינאריות.
מה VIF יכול להגיד לך?
כאשר Ri2 שווה ל-0, ולפיכך, כאשר VIF או סובלנות שווה ל-1, המשתנה ה-ithin-תלוי אינו מתאם לנותרים, כלומר לא קיימת מולטי-קולינאריות.
במונחים כלליים,
ככל שה-VIF גבוה יותר, כך הסיכוי שקיימת מולטי-קולינאריות גבוהה יותר, ונדרש מחקר נוסף. כאשר VIF גבוה מ-10, יש רב-קוליניאריות משמעותית שצריך לתקן.
דוגמה לשימוש ב-VIF
לדוגמה, נניח שכלכלן רוצה לבדוק האם יש קשר מובהק סטטיסטית בין שיעור האבטלה (משתנה בלתי תלוי) לבין שיעור האינפלציה (משתנה תלוי). הכללת משתנים בלתי תלויים נוספים הקשורים לשיעור האבטלה, כגון תביעות ראשוניות חדשות לחוסר עבודה, עשויה להכניס מולטי-קולינאריות למודל.
המודל הכולל עשוי להראות כוח הסבר חזק ומספיק מבחינה סטטיסטית, אך אינו מסוגל לזהות אם ההשפעה נובעת בעיקר משיעור האבטלה או מתביעות האבטלה הראשוניות החדשות. זה מה שה-VIF יזהה, והוא יציע אולי להוריד את אחד המשתנים מהמודל או למצוא דרך כלשהי לאחד אותם כדי ללכוד את ההשפעה המשותפת שלהם בהתאם להשערה הספציפית שהחוקר מעוניין לבדוק.
מהו ערך VIF טוב?
ככלל אצבע, VIF של שלוש ומטה אינו סיבה לדאגה. ככל שה-VIF עולה, כך תוצאות הרגרסיה שלך יהיו פחות אמינות.
מה המשמעות של VIF של 1?
VIF השווה לאחד אומר שמשתנים אינם מתואמים ורב-קולינאריות לא קיימת במודל הרגרסיה.
למה משמש VIF?
VIF מודד את עוצמת המתאם בין המשתנים הבלתי תלויים בניתוח רגרסיה. מתאם זה ידוע בשם מולטי-קולינאריות, שעלול לגרום לבעיות במודלים של רגרסיה.
סיכום ומסקנות
בעוד שכמות מתונה של מולטי-קולינאריות מקובלת במודל רגרסיה, מולטי-קולינאריות גבוהה יותר יכולה להוות סיבה לדאגה.
ניתן לנקוט בשני אמצעים כדי לתקן מולטי-קולינאריות גבוהה, ראשית, ניתן להסיר אחד או יותר מהמשתנים בעלי קורלציה גבוהה, מכיוון שהמידע המסופק על ידי משתנים אלו מיותר. השיטה השנייה היא להשתמש בניתוח רכיבים עיקריים או ברגרסיה חלקית בריבוע קטן במקום ברגרסיית OLS, שיכולה לצמצם את המשתנים בהתאמה לקבוצה קטנה יותר ללא מתאם, או ליצור משתנים חדשים שאינם מתואמים. זה ישפר את יכולת הניבוי של מודל.