מהי סטטיסטיקה תיאורית?
מהי סטטיסטיקה תיאורית? סטטיסטיקה תיאורית היא מקדמי מידע קצרים המסכמים מערך נתונים נתון, שיכול להיות ייצוג של כלל האוכלוסייה או מדגם של אוכלוסייה. סטטיסטיקה תיאורית מחולקת למדדים של נטייה מרכזית ומדדי שונות (התפשטות). מדדי נטייה מרכזית כוללים את הממוצע, החציון והמצב, בעוד שמדדים של השונות כוללים סטיית תקן, שונות, משתנים מינימליים ומקסימליים, קורטוזיס ועיוות.מהי סטטיסטיקה תיאורית? סטטיסטיקה תיאורית היא אמצעי לתיאור תכונות של מערך נתונים על ידי הפקת סיכומים על דגימות נתונים. לעתים קרובות הוא מתואר כסיכום של נתונים המוצגים המסבירים את תוכן הנתונים. לדוגמה, מפקד אוכלוסין עשוי לכלול נתונים סטטיסטיים תיאוריים לגבי היחס בין גברים לנשים בעיר מסוימת.
מהי סטטיסטיקה תיאורית? – מהי סטטיסטיקה תיאורית?
סטטיסטיקה תיאורית היא אמצעי לתיאור תכונות של מערך נתונים על ידי הפקת סיכומים על דגימות נתונים. לעתים קרובות הוא מתואר כסיכום של נתונים המוצגים המסבירים את תוכן הנתונים. לדוגמה, מפקד אוכלוסין עשוי לכלול נתונים סטטיסטיים תיאוריים לגבי היחס בין גברים לנשים בעיר מסוימת.
נקודות מרכזיות
הבנת סטטיסטיקה תיאורית
סטטיסטיקה תיאורית, בקיצור, עוזרת לתאר ולהבין את התכונות של מערך נתונים ספציפי על ידי מתן סיכומים קצרים על המדגם והמדדים של הנתונים. הסוגים המוכרים ביותר של סטטיסטיקה תיאורית הם מדדי מרכז: נושא, חציון ומצב, המשמשים כמעט בכל רמות המתמטיקה והסטטיסטיקה. הממוצע, או הממוצע, מחושב על ידי הוספת כל הדמויות בתוך קבוצת הנתונים ולאחר מכן חלוקה במספר הדמויות בתוך הסט.
לדוגמה, הסכום של מערך הנתונים הבא הוא 20: (2, 3, 4, 5, 6). הממוצע הוא 4 (20/5). המצב של מערך נתונים הוא הערך המופיע לרוב, והחציון הוא הדמות הממוקמת באמצע מערך הנתונים. זהו הנתון המפריד בין המספרים הגבוהים למספרים הנמוכים יותר בתוך מערך נתונים. עם זאת, ישנם סוגים פחות נפוצים של סטטיסטיקה תיאורית שעדיין חשובים מאוד.
אנשים משתמשים בסטטיסטיקה תיאורית כדי ליישם מחדש תובנות כמותיות קשות להבנה על פני מערך נתונים גדול לתיאורים בגודל ביס. ממוצע הציונים של תלמיד (GPA), למשל, מספק הבנה טובה של סטטיסטיקה תיאורית. הרעיון של GPA הוא שהוא לוקח נקודות נתונים ממגוון רחב של בחינות, כיתות וציונים, ומעמיד אותן יחד על מנת לספק הבנה כללית של הביצועים האקדמיים הכוללים של התלמיד. הציון האישי של תלמיד משקף את הביצועים האקדמיים הממוצעים שלו.
סוגי סטטיסטיקה תיאורית
כל הנתונים הסטטיסטיים התיאוריים הם או מדדים של נטייה מרכזית או מדדי השתנות, הידועים גם כמדדי פיזור.
נטייה מרכזית
מדדים של נטייה מרכזית מתמקדים בערכים הממוצעים או האמצעיים של מערכי נתונים, בעוד שמדדים של שונות מתמקדים בפיזור הנתונים. שני המדדים האלה משתמשים בגרפים, טבלאות ודיונים כלליים כדי לעזור לאנשים להבין את המשמעות של הנתונים המנותחים.
מדדים של נטייה מרכזית מתארים את המיקום המרכזי של התפלגות עבור מערך נתונים. אדם מנתח את התדירות של כל נקודת נתונים בהתפלגות ומתאר אותה באמצעות ממוצע, חציון או מצב, שמודד את הדפוסים הנפוצים ביותר של מערך הנתונים המנותח.
מדדי השתנות
מדדי שונות (או מדדי התפשטות) מסייעים בניתוח עד כמה ההתפלגות מפוזרת עבור קבוצת נתונים. לדוגמה, בעוד שמדדים של נטייה מרכזית עשויים לתת לאדם את הממוצע של מערך נתונים, הוא אינו מתאר כיצד הנתונים מופצים בתוך המערך.
אז בעוד שהממוצע של הנתונים הוא אולי 65 מתוך 100, עדיין יכולות להיות נקודות נתונים הן ב-1 והן ב-100. מדדים של שונות עוזרים לתקשר זאת על ידי תיאור הצורה והתפשטות של מערך הנתונים. טווח, רבעונים, סטייה מוחלטת ושונות הם כולם דוגמאות למדדים של שונות.
שקול את מערך הנתונים הבא: 5, 19, 24, 62, 91, 100. הטווח של מערך הנתונים הוא 95, אשר מחושב על ידי הפחתת המספר הנמוך ביותר (5) במערך הנתונים מהגבוה ביותר (100).
הפצה
התפלגות (או התפלגות תדרים) מתייחסת לכמות הפעמים שבה מתרחשת נקודת נתונים. לחלופין, זוהי מדידה של נקודת נתונים שלא מתרחשת. שקול מערך נתונים: זכר, זכר, נקבה, נקבה, נקבה, אחר. ניתן לסווג את התפלגות הנתונים הללו כ:
חד משתנים לעומת דו משתנים
בסטטיסטיקה תיאורית, נתונים חד משתנים מנתחים רק משתנה אחד. הוא משמש לזיהוי מאפיינים של תכונה בודדת ואינו משמש לניתוח קשרים או סיבתיות כלשהן.
לדוגמה, דמיינו חדר מלא בתלמידי תיכון. נניח שרצית לאסוף את הגיל הממוצע של האנשים בחדר. נתונים חד משתנים אלה תלויים רק בגורם אחד: גילו של כל אדם. על ידי איסוף פיסת מידע אחת זו מכל אדם וחלוקה במספר הכולל של אנשים, תוכל לקבוע את הגיל הממוצע.
נתונים דו משתנים, לעומת זאת, מנסים לקשר בין שני משתנים על ידי חיפוש מתאם. נאספים שני סוגי נתונים, והקשר בין שני פיסות המידע מנותח יחד. מכיוון שמנתחים משתנים מרובים, ניתן להתייחס לגישה זו גם כ-multivariate.
נניח שכל תלמיד תיכון בדוגמה שלמעלה עובר מבחן הערכה במכללה, ואנו רוצים לראות אם תלמידים מבוגרים יותר נבחנים טוב יותר מתלמידים צעירים יותר. בנוסף לאיסוף גיל התלמידים, עלינו לאסוף את ציון המבחן של כל תלמיד. לאחר מכן, באמצעות ניתוח נתונים, אנו מתארים באופן מתמטי או גרפי אם יש קשר בין גיל התלמידים וציוני המבחנים.
סטטיסטיקה תיאורית לעומת סטטיסטיקה מסקנתית
לסטטיסטיקה תיאורית יש פונקציה שונה מסטטיסטיקה מסקנת, מערכי נתונים המשמשים לקבלת החלטות או להחיל מאפיינים ממערך נתונים אחד לאחר.
תארו לעצמכם דוגמה נוספת שבה חברה מוכרת רוטב חריף. החברה אוספת נתונים כגון ספירת המכירות, כמות רכישה ממוצעת לכל עסקה ומכירה ממוצעת ליום בשבוע. כל המידע הזה הוא תיאורי, שכן הוא מספר סיפור של מה שקרה בפועל בעבר. במקרה זה, לא נעשה בו שימוש מעבר למידע.
נניח שאותה חברה רוצה לגלגל רוטב חריף חדש. הוא אוסף את אותם נתוני מכירות לעיל, אבל הוא יוצר את המידע כדי ליצור תחזיות לגבי המכירות של הרוטב החם החדש. הפעולה של שימוש בסטטיסטיקה תיאורית והחלת מאפיינים על מערך נתונים אחר הופך את מערך הנתונים לסטטיסטיקה מסקנתית. אנחנו כבר לא רק מסכמים נתונים; אנו משתמשים בו לחזות מה יקרה לגבי גוף נתונים אחר לגמרי (מוצר הרוטב החם החדש).
מהן דוגמאות לסטטיסטיקה תיאורית?
סטטיסטיקה תיאורית היא אינפורמטיבית ונועדה לתאר את המאפיינים האמיתיים של מערך נתונים. כאשר מנתחים מספרים לגבי עונת הבייסבול הקודמת של ליגת העל, סטטיסטיקה תיאורית הכוללת את ממוצע החבטות הגבוה ביותר עבור שחקן בודד, מספר הריצות המותרות לקבוצה וממוצע הניצחונות לליגה.
מהי המטרה העיקרית של סטטיסטיקה תיאורית?
המטרה העיקרית של סטטיסטיקה תיאורית היא לספק מידע על מערך נתונים. בדוגמה למעלה, ישנם מאות שחקני בייסבול שעוסקים באלפי משחקים. סטטיסטיקה תיאורית מסכמת את כמות הנתונים הגדולה למספר פיסות מידע שימושיות.
מהם סוגי הסטטיסטיקה התיאורית?
שלושת הסוגים העיקריים של סטטיסטיקה תיאורית הם התפלגות תדירות, נטייה מרכזית ושונות של מערך נתונים. התפלגות התדירות מתעדת באיזו תדירות מתרחשים נתונים, נטייה מרכזית מתעדת את נקודת ההפצה המרכזית של הנתונים, והשונות של מערך נתונים מתעדת את מידת הפיזור שלו.
האם ניתן להשתמש בסטטיסטיקה תיאורית להסקת מסקנות או תחזיות?
לא. בעוד שתיאורים אלה עוזרים להבין את תכונות הנתונים, נדרשות טכניקות סטטיסטיות מסקנות – ענף נפרד של סטטיסטיקה – כדי להבין כיצד משתנים מקיימים אינטראקציה זה עם זה במערך נתונים.
סיכום ומסקנות
סטטיסטיקה תיאורית מתייחסת לניתוח, סיכום ותקשורת של ממצאים המתארים מערך נתונים. לעתים קרובות לא שימושי עבור קבלת החלטות, סטטיסטיקה תיאורית עדיין מכילה ערך בהסבר סיכומים ברמה גבוהה של קבוצת מידע כגון ממוצע, חציון, מצב, שונות, טווח וספירת מידע.