מהו הסכום השיורי של הריבועים (RSS)?
מהו הסכום השיורי של הריבועים (RSS)? הסכום השיורי של ריבועים (RSS) הוא טכניקה סטטיסטית המשמשת למדידת כמות השונות בקבוצת נתונים שאינה מוסברת על ידי מודל רגרסיה עצמו. במקום זאת, הוא מעריך את השונות במונחי השאריות או השגיאה. רגרסיה לינארית היא מדידה שעוזרת לקבוע את עוצמת הקשר בין משתנה תלוי לגורם אחד או יותר, הידוע כמשתנים בלתי תלויים או מסבירים.
מהו הסכום השיורי של הריבועים (RSS)? – רגרסיה לינארית היא מדידה שעוזרת לקבוע את עוצמת הקשר בין משתנה תלוי לגורם אחד או יותר, הידוע כמשתנים בלתי תלויים או מסבירים.
מהו הסכום השיורי של הריבועים (RSS)? – נקודות מרכזיות
הבנת הסכום השארי של ריבועים
במונחים כלליים, סכום הריבוע הוא טכניקה סטטיסטית המשמשת בניתוח רגרסיה כדי לקבוע את פיזור נקודות הנתונים. בניתוח רגרסיה, המטרה היא לקבוע באיזו מידה ניתן להתאים סדרת נתונים לפונקציה שעשויה לעזור להסביר כיצד נוצרה סדרת הנתונים. סכום הריבועים משמש כדרך מתמטית למצוא את הפונקציה המתאימה ביותר (הכי פחות משתנה) מהנתונים.
ה-RSS מודד את כמות השגיאה שנותרה בין פונקציית הרגרסיה למערך הנתונים לאחר הפעלת המודל. נתון RSS קטן יותר מייצג פונקציית רגרסיה שמתאימה היטב לנתונים.
ה-RSS, הידוע גם כסכום השאריות בריבוע, קובע בעצם עד כמה מודל רגרסיה מסביר או מייצג את הנתונים במודל.
סכום שיורי של ריבועים (RSS) לעומת שגיאת תקן שארית (RSE)
שגיאת התקן השיורית (RSE) היא מונח סטטיסטי נוסף המשמש לתיאור ההבדל בין סטיות התקן של ערכים נצפים לעומת ערכים חזויים כפי שמוצגים בנקודות בניתוח רגרסיה. ניתן להשתמש ב-godness-of-fitmeasure כדי לנתח את מידת ההתאמה של קבוצת נקודות נתונים למודל בפועל.
RSE מחושב על ידי חלוקת ה-RSS במספר התצפיות במדגם פחות 2, ולאחר מכן לקיחת השורש הריבועי: RSE = [RSS/(n-2)]1/2
נסיבות ייחודיות
השווקים הפיננסיים הפכו יותר ויותר מונעים כמותית; ככזה, בחיפוש אחר יתרון, משקיעים רבים משתמשים בטכניקות סטטיסטיות מתקדמות כדי לסייע בהחלטותיהם. יישומי ביג דאטה, למידת מכונה ובינה מלאכותית מחייבים שימוש נוסף במאפיינים סטטיסטיים כדי להנחות אסטרטגיות השקעה עכשוויות. הסכום השיורי של ריבועים – או סטטיסטיקת RSS – הוא אחד ממאפיינים סטטיסטיים רבים שנהנים מחידוש.
מודלים סטטיסטיים משמשים משקיעים ומנהלי תיקים כדי לעקוב אחר מחיר ההשקעה ולהשתמש בנתונים אלה כדי לחזות תנועות עתידיות. המחקר – הנקרא ניתוח רגרסיה – עשוי לכלול ניתוח הקשר בתנועות המחירים בין סחורה למניות של חברות העוסקות בייצור הסחורה.
לכל מודל עשויות להיות שונות בין הערכים החזויים לתוצאות בפועל. למרות שהשונות עשויות להיות מוסברות על ידי ניתוח הרגרסיה, ה-RSS מייצג את השונות או השגיאות שאינן מוסברות.
מכיוון שניתן ליצור פונקציית רגרסיה מורכבת מספיק כך שתתאים כמעט לכל מערך נתונים, יש צורך במחקר נוסף כדי לקבוע אם פונקציית הרגרסיה היא, למעשה, שימושית בהסבר השונות של מערך הנתונים.
עם זאת, בדרך כלל, ערך קטן יותר או נמוך יותר עבור ה-RSS הוא אידיאלי בכל מודל שכן זה אומר שיש פחות שונות במערך הנתונים. במילים אחרות, ככל שסכום השאריות בריבוע נמוך יותר, כך מודל הרגרסיה טוב יותר בהסבר הנתונים.
דוגמה לסכום השיורי של הריבועים
להדגמה פשוטה (אך ארוכה) של חישוב ה-RSS, שקול את המתאם הידוע בין ההוצאות הצרכניות של המדינה לבין התמ"ג שלה. התרשים הבא משקף את הערכים שפורסמו של הוצאות צרכנים והתוצר המקומי הגולמי עבור 27 מדינות האיחוד האירופי, נכון ל-2020.
הוצאות צרכנים לעומת תוצר עבור מדינות חברות באיחוד האירופי מדינה הוצאות צרכנים (מיליונים) תמ"ג (מיליונים) אוסטריה309,018.88433,258.47בלגיה388,436.00521,861.29בולגריה54,647.39163,39163,39165,39165,39169,38433,258.47,647.39163,39165,309,305,388433,258.47 78קפריסין20,592.7424,612.65צ'כיה164,933.47245,349.49דנמרק251, 478.47356,084.87אסטוניה21,776.0030,650.29פינלנד203,731.24269,751.31צרפת2,057,126.032,630,317.73גרמניה2,814,73Gre2,814,73Gre,7134,73Gre ,893.21188,835.20הונגריה110,323.35155,808.44אירלנד160,561.07425,888.95איטליה1,486,910.441,888,709.44לטביה67.43727,437 לטביה25,437 לטביה 27,437 679.2056,546.96Luxembourg35,953.2973,353.13Malta9,808.7614,647.38הולנד620,050.30913,865.40Poland453,186.124596,69236,624596,69236,624596,692596 9.25רומניה198,867.77248,715.55הרפובליקה הסלובקית83,845.27105,172.56סלובניה37,929.2453,589.61ספרד997,452.451,281,484.64SwedenSweden ,240.92541,220.06הבנק העולמי, 2020.
להוצאות הצרכנים ולתמ"ג יש מתאם חיובי חזק, וניתן לחזות את התמ"ג של מדינה בהתבסס על הוצאות הצרכנים (CS). באמצעות הנוסחה של קו התאמה, ניתן להעריך קשר זה כך:
GDP = 1.3232 x CS + 10447
יחידות התמ"ג וההוצאות הצרכניות הן במיליוני דולרים.
נוסחה זו מדויקת ביותר עבור רוב המטרות, אך היא אינה מושלמת, בשל השונות האינדיבידואלית בכלכלת כל מדינה. התרשים הבא משווה את התמ"ג החזוי של כל מדינה, בהתבסס על הנוסחה לעיל, לבין התמ"ג בפועל כפי שנרשם על ידי הבנק העולמי.
נתוני התמ"ג החזויים והממשי עבור מדינות החברות באיחוד האירופי, וריבועים שיוריים מדינה הוצאות צרכנים ערך אחרון (מיליונים) תמ"ג ערך אחרון (מיליונים) תמ"ג חזוי (מבוסס על קו מגמה) ריבוע שיורי (חזוי – אמיתי)^2אוסטריה309,018.884433,419,319,419,419,319,419,309,419,309,019 702,038.819978בלגיה388,436.00521,861.29524,425.526,575,250.87631504בולגריה54,647.3169,889.3582,756.169a,8156.1620C 47,392.8657,203.7873,157.232352254,512,641.947534Cyprus20,592.7424,612.6537,695.313568171,156,0474Czech.356,0864Cze 49228,686.967504277,639,655.929706דנמרק251,478.47356 , 084.87343,203.311504165,934,549.28587estonia21,776.0030,650.2939,261.0074,1444,381.8126542fin203,7331.24269,75126165.7617.7616.17616.17617.176.1716., 33079 france2,057,126.032,630,317.732,732,436.16289610,428,174,337.1349germany2,812,718.453,846,413.9333,73641 Reece174,893.21188,835.20241,865.6954722, 812,233,450.00581הונגריה110,323.35155,808.44156,426.85672382,439.239575558אירלנד160,561.07425,888.905142,3024421,302425,888.9052421,3024421,302425,888.905242. .6534איטליה1,486,910.441,888,709.441,977,926.8942087,959,754,135.35658לטביה25,776.7433,707.3244,5354.71671,73671,7367,5354,5354,5354,7354,5354,7354,5354. 43,679.2056,546.9668,243.32136,804,777.364243Luxembourg35,953.2973, 353.1358,020.393328235,092,813.852894מלטה9,808.7614,647.3823,425.95123277,063,312.875298הולנד6805,064.875298הולנד6805,054,630,064 ,883,662,978.71פולין453,186.14596,624.36610,102.900448181,671,052.608372פורטוגל190,509.98228,539.225918,355462,355462,355262,355462,355262,355262,355262,539.225262 9רומניה198,867.77248,715.55273,588.833264618,680,220.331183 הרפובליקה הסלובקית83,845.27105,172.56121,391.061264263,039,783.25037סלובניה37,929.2453,589.6160,634.97036849,637,429.4929,637,429,1529,637,429,129,129 81,484.641,330,276.081842,380,604,796.8261שבדיה382,240.92541,220.06516,228.185344624,593,798.8212, 593,798.8212.
העמודה מימין מציינת את הריבועים השיוריים – ההפרש בריבוע בין כל ערך מוקרן לערכו האמיתי. המספרים נראים גדולים, אבל הסכום שלהם למעשה נמוך מה-RSS עבור כל קו מגמה אפשרי אחר. אם לקו אחר היה RSS נמוך יותר עבור נקודות הנתונים הללו, הקו הזה יהיה הקו המתאים ביותר.
האם הסכום השיורי של הריבועים זהה ל-R-ריבוע?
הסכום השיורי של הריבועים (RSS) הוא הכמות המוחלטת של הווריאציה המוסברת, בעוד ש-R-squad הוא הכמות המוחלטת של הווריאציה כשיעור מסך הווריאציה.
האם RSS זהה לסכום האומדן בריבוע של שגיאות (SSE)?
הסכום השיורי של הריבועים (RSS) ידוע גם כסכום האומדן בריבוע של טעויות (SSE).
מה ההבדל בין הסכום השיורי של הריבועים לסכום הכולל של הריבועים?
הסכום הכולל של הריבועים (TSS) מודד כמה שונות יש בנתונים הנצפים, בעוד שהסכום השיורי של הריבועים מודד את השונות בשגיאה בין הנתונים הנצפים לערכים המודגם. בסטטיסטיקה, הערכים עבור הסכום השיורי של הריבועים והסכום הכולל של הריבועים (TSS) מושווים לעתים קרובות זה לזה.
האם סכום שיורי של ריבועים יכול להיות אפס?
הסכום השיורי של ריבועים יכול להיות אפס. ככל שהסכום השיורי של ריבועים קטן יותר, כך המודל שלך מתאים יותר לנתונים שלך; ככל שהסכום השיורי של ריבועים גדול יותר, כך המודל שלך מתאים יותר לנתונים שלך. ערך של אפס אומר שהדגם שלך מתאים באופן מושלם.