מה זה רבעון?
מה זה רבעון? רבעון הוא מונח אסטטיסטי המתאר חלוקה של תצפיות לארבעה מרווחים מוגדרים בהתבסס על ערכי הנתונים וכיצד הם משתווים לכל מערך התצפיות.
מה זה רבעון? – נקודות מרכזיות
הבנת רבעים
כדי להבין את הרבעון, חשוב להבין את המדד של הנטייה המרכזית. החציון בסטטיסטיקה הוא הערך האמצעי של קבוצת מספרים. זוהי הנקודה שבה בדיוק מחצית מהנתונים נמצאים מתחת ומעל לערך המרכזי.
אז בהינתן קבוצה של 13 מספרים שממוינים (עולה או יורד), החציון יהיה המספר השביעי. ששת המספרים הקודמים לערך זה הם המספרים הנמוכים ביותר בנתונים, וששת המספרים שאחרי החציון הם המספרים הגבוהים ביותר במערך הנתונים. מכיוון שהחציון אינו מושפע מערכי קיצון או חריגים בהתפלגות, לעתים הוא מועדף על תמה.
החציון הוא אומדן חזק של המיקום, אך אינו אומר דבר על האופן שבו הנתונים משני צידי הערך שלו מתפזרים או מתפזרים. זה המקום שבו הרבעון נכנס. הרבעון מודד את התפשטות הערכים מעל ומתחת לממוצע על ידי חלוקת ההתפלגות לארבע קבוצות.
כיצד פועלים הרבעים
בדיוק כמו שהחציון מחלק את הנתונים לחצי כך ש-50% מהמדידה נמצאת מתחת לחציון ו-50% נמצא מעליו, הרבעון מפרק את הנתונים לרבעים כך ש-25% מהמדידות פחותות מהרבעון התחתון, 50 % הם פחות מהחציון, ו-75% הם פחות מהרבעון העליון.
ישנם שלושה ערכי רבעון – רבעון תחתון, חציון ורבעון עליון – כדי לחלק את מערך הנתונים לארבעה טווחים, שכל אחד מכיל 25% מנקודות הנתונים. הרבעון התחתון, או הרבעון הראשון, מסומן כ-Q1 והוא המספר האמצעי הנופל בין הערך הקטן ביותר של מערך הנתונים לבין החציון. הרבעון השני, Q2, הוא גם החציון. הרבעון העליון או השלישי, המסומן כ-Q3, הוא הנקודה המרכזית שנמצאת בין החציון למספר הגבוה ביותר של ההתפלגות.
כעת, אנו יכולים למפות את ארבע הקבוצות שנוצרו מהרבעונים. קבוצת הערכים הראשונה מכילה את המספר הקטן ביותר עד Q1; הקבוצה השנייה כוללת Q1 לחציון; הסט השלישי הוא החציון ל-Q3; הקטגוריה הרביעית כוללת Q3 עד לנקודת הנתונים הגבוהה ביותר של כל הסט.
כל מרווח מכיל 25% מסך התצפיות. בדרך כלל, הנתונים מסודרים מהקטן לגדול ביותר:
דוגמה לרבעון
נניח שהתפלגות ציוני המתמטיקה בכיתה של 19 תלמידים בסדר עולה היא:
ראשית, סמן את החציון, Q2, שבמקרה זה הוא הערך ה-10: 75.
Q1 היא הנקודה המרכזית בין הציון הקטן ביותר לחציון. במקרה זה, Q1 נופל בין הציון הראשון לחמישי: 68. (שים לב שניתן לכלול את החציון גם בעת חישוב Q1 או Q3 עבור קבוצת ערכים אי-זוגית. אם היינו כוללים את החציון משני צדי נקודת האמצע. , אז Q1 יהיה הערך האמצעי בין הציון הראשון ל-10, שהוא הממוצע של הציון החמישי והשישי – (חמישי + שישי)/2 = (68 + 69)/2 = 68.5).
Q3 הוא הערך האמצעי בין Q2 לציון הגבוה ביותר: 84. (או אם אתה כולל את החציון, Q3 = (82 + 84)/2 = 83).
עכשיו כשיש לנו את הרביעונים שלנו, בואו נפרש את המספרים שלהם. ציון של 68 (Q1) מייצג את הרבעון הראשון והוא האחוזון ה-25. 68 הוא החציון של החצי התחתון של הציון שנקבע בנתונים הזמינים – כלומר, החציון של הציונים מ-59 עד 75.
הרבעון הראשון אומר לנו ש-25% מהציונים נמוכים מ-68 ו-75% מהציונים בכיתה גדולים יותר. Q2 (החציון) הוא האחוזון ה-50 ומראה ש-50% מהציונים הם פחות מ-75, ו-50% מהציונים הם מעל 75. לבסוף, Q3, האחוזון ה-75, מגלה ש-25% מהציונים גדולים יותר ו-75% הם פחות מ-84.
נסיבות ייחודיות
אם נקודת הנתונים עבור Q1 רחוקה יותר מהחציון מאשר Q3 מהחציון, אז אנחנו יכולים לומר שיש פיזור גדול יותר בין הערכים הקטנים יותר של מערך הנתונים מאשר בין הערכים הגדולים יותר. אותו היגיון חל אם Q3 רחוק יותר מ-Q2 מאשר Q1 מהחציון.
לחלופין, אם יש מספר זוגי של נקודות נתונים, החציון יהיה הממוצע של שני המספרים האמצעיים. בדוגמה שלנו למעלה, אם היו לנו 20 תלמידים במקום 19, החציון של הציונים שלהם יהיה ממוצע אריתמטי של מספרי 10 ו-11.
רבעונים משמשים לחישוב הטווח הבין-רבעוני, שהוא מדד של שונות סביב החציון. הטווח הבין-רבעוני מחושב פשוט כהפרש בין הרבעון הראשון לשלישי: Q3-Q1. למעשה, הטווח של החצי האמצעי של הנתונים הוא שמראה עד כמה הנתונים מפוזרים.
עבור מערכי נתונים גדולים, ל-Microsoft Excel יש פונקציה QUARTILE לחישוב רבעונים.
איך מוצאים את הרבעון התחתון של מערך נתונים?
הרבעון התחתון של מערך נתונים הוא נקודה שבה כ-25% מהתצפיות נמצאות מתחת לנקודה זו, ו-75% מנקודות הנתונים נמצאות מעל לנקודה זו. במילים אחרות, זהו הערך האמצעי בין נקודת הנתונים הנמוכה ביותר לבין החציון של מערך הנתונים.
איך מוצאים את הרבעון העליון של מערך נתונים?
הרבעון העליון הוא הנקודה שבה כ-75% מהתצפיות נמצאות מתחת לנקודה זו ו-25% מהתצפיות גבוהות מנקודה זו. במילים אחרות, זהו הערך האמצעי בין החציון של מערך הנתונים לערך המקסימלי.
מהו הטווח הבין-רבעוני של מערך נתונים?
הטווח הבין-רבעוני הוא ה-50% האמצעיים של המדידות במערך נתונים – במילים אחרות, טווח הנתונים בין הרבעון העליון לרבעון התחתון. זה יותר משמעותי מבחינה סטטיסטית מאשר שימוש בכל מגוון הנתונים, מכיוון שהוא משמיט חריגים אפשריים.