מהי רגרסיה לינארית מרובת (MLR)?
מהי רגרסיה לינארית מרובת (MLR)? רגרסיה ליניארית מרובה (MLR), הידועה גם בשם רגרסיה מרובה, היא טכניקה סטטיסטית המשתמשת במספר משתנים מסבירים כדי לחזות את התוצאה של משתנה תגובה. המטרה של רגרסיה ליניארית מרובה היא לדמות את הקשר הליניארי בין המשתנים המסבירים (הבלתי תלויים) ומשתני התגובה (תלויים). בעצם, רגרסיה מרובה היא הרחבה של רגרסיה רגילה בריבועים קטנים (OLS) מכיוון שהיא כוללת יותר ממשתנה מסביר אחד.
מהי רגרסיה לינארית מרובת (MLR)? – נקודות מרכזיות
מה רגרסיה לינארית מרובה יכולה להגיד לך
רגרסיה ליניארית פשוטה היא פונקציה המאפשרת לאנליסט או סטטיסטיקאי לבצע תחזיות לגבי משתנה אחד על סמך המידע הידוע לגבי משתנה אחר. רגרסיה ליניארית יכולה לשמש רק כאשר לאחד יש שני משתנים רציפים – משתנה בלתי תלוי ומשתנה תלוי. המשתנה הבלתי תלוי הוא הפרמטר המשמש לחישוב המשתנה התלוי או התוצאה. מודל רגרסיה מרובה משתרע על מספר משתני הסבר.
מודל הרגרסיה המרובה מבוסס על ההנחות הבאות:
מקדם הקביעה (R-squad) הוא מדד סטטיסטי המשמש למדידת כמה מהשונות בתוצאה ניתן להסביר על ידי השונות במשתנים הבלתי תלויים. R2 תמיד גדל ככל שמתווספים יותר מנבאים למודל MLR, למרות שהמנבאים עשויים שלא להיות קשורים למשתנה התוצאה.
לפיכך, לא ניתן להשתמש ב-R2 בפני עצמו כדי לזהות אילו מנבאים צריכים להיכלל במודל ואילו יש להחריג. R2 יכול להיות רק בין 0 ל-1, כאשר 0 מציין שלא ניתן לחזות את התוצאה על ידי אף אחד מהמשתנים הבלתי תלויים ו-1 מציין שניתן לחזות את התוצאה ללא שגיאה מהמשתנים הבלתי תלויים.
כאשר מפרשים את התוצאות של רגרסיה מרובה, מקדמי בטא תקפים תוך החזקת כל שאר המשתנים קבועים ("כל השאר שווים"). ניתן להציג את הפלט מרגרסיה מרובה בצורה אופקית כמשוואה, או אנכית בצורת טבלה.
דוגמה כיצד להשתמש ברגרסיה לינארית מרובה
כדוגמה, אנליסט עשוי לרצות לדעת כיצד תנועת השוק משפיעה על המחיר של ExxonMobil (XOM). במקרה זה, המשוואה הליניארית שלהם תהיה בעלת הערך של מדד S&P 500 כמשתנה הבלתי תלוי, או המנבא, והמחיר של XOM כמשתנה התלוי.
במציאות, גורמים רבים מנבאים את התוצאה של אירוע. תנועת המחירים של ExxonMobil, למשל, תלויה ביותר מאשר רק בביצועי השוק הכולל. מנבאים אחרים כגון מחיר הנפט, שיעורי הריבית ותנועת המחירים של הנפט העתידיים יכולים להשפיע על מחירה של אקסון מוביל (XOM) ועל מחירי המניות של חברות נפט אחרות. כדי להבין קשר שבו קיימים יותר משני משתנים, נעשה שימוש ברגרסיה ליניארית מרובה.
רגרסיה ליניארית מרובה (MLR) משמשת לקביעת קשר מתמטי בין מספר משתנים אקראיים. במונחים אחרים, MLR בוחן כיצד מספר משתנים בלתי תלויים קשורים למשתנה תלוי אחד. לאחר שכל אחד מהגורמים הבלתי תלויים נקבע לחזות את המשתנה התלוי, ניתן להשתמש במידע על המשתנים המרובים כדי ליצור חיזוי מדויק לגבי רמת ההשפעה שיש להם על משתנה התוצאה. המודל יוצר קשר בצורה של קו ישר (ליניארי) שמקרוב בצורה הטובה ביותר את כל נקודות הנתונים הבודדות.
בהתייחס למשוואת MLR לעיל, בדוגמה שלנו:
אומדני הריבועים הקטנים ביותר – B0, B1, B2…Bp – מחושבים בדרך כלל על ידי תוכנה סטטיסטית. ניתן לכלול משתנים רבים במודל הרגרסיה שבו כל משתנה בלתי תלוי מובחן במספר-1,2, 3, 4…עמ'. מודל הרגרסיה המרובה מאפשר לאנליסט לחזות תוצאה על סמך מידע המסופק על מספר משתנים מסבירים.
ובכל זאת, המודל לא תמיד מדויק לחלוטין מכיוון שכל נקודת נתונים יכולה להיות שונה מעט מהתוצאה שחוזה המודל. הערך השיורי, E, שהוא ההפרש בין התוצאה בפועל לתוצאה החזויה, נכלל במודל כדי להסביר שינויים קלים כאלה.
בהנחה שאנו מפעילים את מודל רגרסיית המחירים XOM שלנו באמצעות תוכנת חישוב סטטיסטיקה, שמחזירה את הפלט הזה:
אנליסט יפרש את התפוקה הזו כך שאם משתנים אחרים יישארו קבועים, המחיר של XOM יעלה ב-7.8% אם מחיר הנפט בשווקים יעלה ב-1%. עוד עולה מהמודל שמחיר XOM ירד ב-1.5% בעקבות עליית ריבית של 1%. R2 מצביע על כך ש-86.5% מהשינויים במחיר המניה של אקסון מוביל יכולים להיות מוסברים על ידי שינויים בשיעור הריבית, מחיר הנפט, החוזים העתידיים על הנפט ומדד S&P 500.
ההבדל בין רגרסיה ליניארית למרובה
רגרסיית ריבועים ליניאריים רגילים (OLS) משווה את התגובה של משתנה תלוי בהינתן שינוי במשתנים מסבירים מסוימים. עם זאת, משתנה תלוי אינו מוסבר רק על ידי משתנה אחד. במקרה זה, אנליסט משתמש ברגרסיה מרובה, המנסה להסביר משתנה תלוי באמצעות יותר ממשתנה בלתי תלוי אחד. רגרסיות מרובות יכולות להיות ליניאריות ולא ליניאריות.
רגרסיות מרובות מבוססות על ההנחה שיש קשר ליניארי בין המשתנים התלויים והבלתי תלויים. זה גם מניח שאין מתאם משמעותי בין המשתנים הבלתי תלויים.
מה הופך רגרסיה מרובה לכפולה?
רגרסיה מרובה מחשיבה את ההשפעה של יותר ממשתני הסבר אחד על תוצאת עניין כלשהי. הוא מעריך את ההשפעה היחסית של משתנים מסבירים, או בלתי תלויים, אלה על המשתנה התלוי כאשר מחזיקים את כל שאר המשתנים בקבוע המודל.
מדוע להשתמש ברגרסיה מרובה על פני רגרסיה פשוטה של OLS?
לעתים נדירות מוסבר משתנה תלוי רק על ידי משתנה אחד. במקרים כאלה, אנליסט משתמש ברגרסיה מרובה, המנסה להסביר משתנה תלוי באמצעות יותר ממשתנה בלתי תלוי אחד. המודל, לעומת זאת, מניח שאין מתאמים עיקריים בין המשתנים הבלתי תלויים.
האם אני יכול לעשות רגרסיה מרובה ביד?
זה לא סביר שכן מודלים מרובים של רגרסיה הם מורכבים והופכים אפילו יותר כאשר יש יותר משתנים הכלולים במודל או כאשר כמות הנתונים לניתוח גדלה. כדי להפעיל רגרסיה מרובה, סביר להניח שתצטרך להשתמש בתוכנות סטטיסטיות מיוחדות או בפונקציות בתוך תוכנות כמו Excel.
מה המשמעות של רגרסיה מרובה ליניארית?
ברגרסיה ליניארית מרובה, המודל מחשב את קו ההתאמה הטוב ביותר שממזער את השונות של כל אחד מהמשתנים הכלולים בהתייחס למשתנה התלוי. בגלל שהוא מתאים לקו, זה מודל ליניארי. ישנם גם מודלים של רגרסיה לא ליניארית הכוללים משתנים מרובים, כגון רגרסיה לוגיסטית, רגרסיה ריבועית ומודלי פרוביט.
כיצד משתמשים במודלים מרובים של רגרסיה בפיננסים?
כל מודל אקונומטרי שמסתכל על יותר ממשתנה אחד עשוי להיות מרובה. מודלים של גורמים משווים שני גורמים או יותר כדי לנתח קשרים בין משתנים לביצועים המתקבלים. TheFama ו-French Three-Factor Modis מודל כזה שמתרחב על מודל תמחור נכסי הון (CAPM) על ידי הוספת גורמי סיכון לגודל וערך לגורם סיכון השוק ב-CAPM (שהוא עצמו מודל רגרסיה). על ידי הכללת שני גורמים נוספים אלה, המודל מתאים את הנטייה לביצועים טובים יותר, מה שנחשב להפוך אותו לכלי טוב יותר להערכת ביצועי מנהל.