מהו הממוצע של Winsorized?
מהו הממוצע של Winsorized? Winsorized mean היא שיטת מיצוע שמחליפה בתחילה את הערכים הקטנים והגדולים ביותר בתצפיות הקרובות ביותר אליהם. זה נעשה כדי להגביל את ההשפעה של חריגים או ערכי קיצון חריגים, או חריגים, על החישוב. לאחר החלפת הערכים, נעשה שימוש בנוסחה ממוצעת אריתמטית כדי לחשב את הממוצע המיועד.
מהו הממוצע של Winsorized? – לאחר החלפת הערכים, נעשה שימוש בנוסחה ממוצעת אריתמטית כדי לחשב את הממוצע המיועד.
מהו הממוצע של Winsorized? – מבחר נקודות מפתח
מה הפירוש של Winsorized אומר לך?
הממוצע המנצח פחות רגיש לחריגים מכיוון שהוא יכול להחליף אותם בערכים פחות קיצוניים. כלומר, הוא פחות רגיש לחריגים לעומת הממוצע האריתמטי. עם זאת, אם להתפלגות יש זנבות שומן, להשפעה של הסרת הערכים הגבוהים והנמוכים ביותר בהתפלגות תהיה השפעה מועטה בגלל מידת השונות הגבוהה בדמויות ההתפלגות.
אחד החסרונות העיקריים של אמצעי Winsorized הוא שהם מכניסים באופן טבעי הטיה מסוימת למערך הנתונים. על ידי הפחתת ההשפעה של חריגים, הניתוח משתנה לניתוח טוב יותר, אך גם מסיר מידע על הנתונים הבסיסיים.
דוגמה כיצד להשתמש ב- Winsorized Mean
בוא נחשב את הממוצע המיועד עבור מערך הנתונים הבא: 1, 5, 7, 8, 9, 10, 34. בדוגמה זו, אנו מניחים שהממוצע המיועד הוא בסדר הראשון, שבו נחליף את הערכים הקטנים והגדולים ביותר ב- התצפיות הקרובות ביותר שלהם.
מערך הנתונים מופיע כעת כדלקמן: 5, 5, 7, 8, 9, 10, 10. לקיחת ממוצע אריתמטי של הסט החדש מייצר ממוצע מנצח של 7.7, או (5 + 5 + 7 + 8 + 9 + 10 + 10) חלקי 7. שימו לב שהממוצע האריתמטי היה גבוה יותר – 10.6. הממוצע המשוער מפחית למעשה את ההשפעה של ערך 34 כחריג.
או שקול ממוצע מנצח של 20% שלוקח את 10% העליונים ואת 10% התחתונים ומחליף אותם בערך הקרוב ביותר שלהם. אנו נסקור את מערך הנתונים הבא: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. השניים נקודות הנתונים הקטנות והשתיים הגדולות ביותר – 20% מ-20 נקודות הנתונים – יוחלפו בערך הקרוב ביותר שלהן. לפיכך, מערך הנתונים החדש הוא כדלקמן: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. הממוצע המנצח הוא 33.9, או סך הנתונים (678) חלקי המספר הכולל של נקודות הנתונים (20).
Winsorized Mean לעומת Trimmed Mean
הממוצע המיועד כולל שינוי נקודות נתונים, בעוד שהממוצע הגזום כולל הסרת נקודות נתונים. מקובל שהממוצע המנצח והממוצע הקצוץ קרובים או לפעמים שווים זה לזה.