
מהי מדגם אקראי פשוט?
מהי מדגם אקראי פשוט? מדגם אקראי פשוט הוא תת-קבוצה של אוכלוסייה סטטיסטית שבה לכל אחד מחברי המשנה יש הסתברות שווה להיבחר. מדגם אקראי פשוט נועד להיות ייצוג חסר פניות של קבוצה.
מהי מדגם אקראי פשוט? – נקודות מרכזיות
הבנת מדגם אקראי פשוט
חוקרים יכולים ליצור מדגם אקראי פשוט תוך שימוש בכמה שיטות. בשיטת הגרלה, לכל אחד מבני האוכלוסייה נקבע מספר, ולאחר מכן נבחרים מספרים באקראי.
דוגמה למדגם אקראי פשוט יהיה שמות של 25 עובדים שנבחרו מתוך כובע מחברה של 250 עובדים. במקרה זה, האוכלוסייה היא כל 250 העובדים, והמדגם הוא אקראי מכיוון שלכל עובד יש סיכוי שווה להיבחר. דגימה אקראית משמשת במדע לביצוע בדיקות בקרה אקראיות או לניסויים מעוורים.
הדוגמה שבה שמות של 25 עובדים מתוך 250 נבחרים מתוך כובע היא דוגמה לשיטת ההגרלה בעבודה. לכל אחד מ-250 העובדים יוקצה מספר בין 1 ל-250, ולאחר מכן 25 מהמספרים הללו ייבחרו באקראי.
מכיוון שפרטים המרכיבים את תת-הקבוצה של הקבוצה הגדולה יותר נבחרים באקראי, לכל פרט במערך האוכלוסייה הגדול יש אותה הסתברות להיבחר. זה יוצר, ברוב המקרים, תת-קבוצה מאוזנת הנושאת את הפוטנציאל הגדול ביותר לייצוג הקבוצה הגדולה כולה.
עבור אוכלוסיות גדולות יותר, שיטת הגרלה ידנית יכולה להיות די מכבידה. בחירת מדגם אקראי מאוכלוסיה גדולה מצריכה בדרך כלל תהליך ממוחשב, שבו נעשה שימוש באותה מתודולוגיה כמו שיטת ההגרלה, רק הקצאות המספרים והבחירות הבאות מתבצעות על ידי מחשבים, לא בני אדם.
מקום לטעות
עם מדגם אקראי פשוט, צריך להיות מקום לטעות המיוצגת על ידי שונות פלוס ומינוס (שגיאת דגימה). לדוגמה, אם בבית ספר תיכון של 1,000 תלמידים היו נערכים סקר כדי לקבוע כמה תלמידים הם שמאליים, דגימה אקראית יכולה לקבוע ששמונה מתוך 100 הנדגמים הם שמאליים. המסקנה תהיה ש-8% מאוכלוסיית התלמידים של התיכון הם שמאליים, כאשר למעשה הממוצע העולמי יהיה קרוב יותר ל-10%.
הדבר נכון ללא קשר לנושא. סקר על האחוז מאוכלוסיית התלמידים שיש להם עיניים ירוקות או מגבלה פיזית יביא להסתברות מתמטית המבוססת על סקר אקראי פשוט, אבל תמיד עם שונות פלוס או מינוס. הדרך היחידה לקבל דיוק של 100% תהיה לסקר את כל 1,000 התלמידים, שאמנם זה אפשרי, אבל לא יהיה מעשי.
כיצד לערוך דגימה אקראית פשוטה
תהליך הדגימה האקראי הפשוט כולל שלבי גודל. כל שלב הרבה להתבצע בסדר עוקב.
שלב 1: הגדר את האוכלוסייה
מקור הניתוח הסטטיסטי הוא קביעת בסיס האוכלוסייה. זו הקבוצה שבה אתה רוצה ללמוד עוד, לאשר השערה או לקבוע תוצאה סטטיסטית. שלב זה הוא פשוט לזהות מהו אותו בסיס אוכלוסיה ולהבטיח שהקבוצה תכסה כראוי את התוצאה שלשמה אתה מנסה לפתור.
דוגמה: אני רוצה ללמוד כיצד הביצועים של המניות של החברות הגדולות בארצות הברית היו במהלך 20 השנים האחרונות. האוכלוסייה שלי היא החברות הגדולות ביותר בארצות הברית כפי שנקבע על ידי S&P 500.
שלב 2: בחר גודל דוגמה
לפני בחירת היחידות בתוך אוכלוסייה, עלינו לקבוע כמה יחידות לבחור גודל מדגם זה עשוי להיות מוגבל בהתבסס על כמות הזמן, קיצוב ההון או משאבים אחרים הזמינים לניתוח המדגם. עם זאת, שים לב לבחור גודל מדגם גדול מספיק כדי להיות מייצג באמת את האוכלוסייה. בדוגמה שלמעלה, ישנם אילוצים בניתוח הביצועים של כל מניה ב-S&P 500, ולכן אנו רוצים רק לנתח תת-קבוצה של אוכלוסייה זו.
דוגמה: גודל המדגם שלי יהיה 20 חברות מ-S&P 500.
שלב 3: קביעת יחידות אוכלוסייה
בדוגמה שלנו, קל לקבוע את הפריטים בתוך האוכלוסייה מכיוון שהם כבר זוהו עבורנו (כלומר החברות הרשומות ב-S&P 500). עם זאת, דמיינו לנתח את הסטודנטים הרשומים כעת לאוניברסיטה או מוצרי מזון הנמכרים במכולת. שלב זה כרוך ביצירת הרשימה המלאה של כל הפריטים באוכלוסיה שלך.
דוגמה: באמצעות מידע החלפה, אני מעתיק את החברות המרכיבות את S&P 500 לגיליון אלקטרוני של Excel.
שלב 4: הקצה ערכים מספריים
תהליך המדגם האקראי הפשוט קורא לכל יחידה באוכלוסיה שמקבלת ערך מספרי לא קשור. זה מוקצה לעתים קרובות על סמך האופן שבו ניתן לסנן את הנתונים. לדוגמה, אני יכול להקצות את המספרים 1 עד 500 לחברות על סמך שווי שוק, אלפביתי או תאריך הקמת החברה. איך הערכים מוקצים לא לגמרי משנה; כל מה שחשוב הוא שכל ערך הוא רציף ולכל ערך יש סיכוי שווה להיבחר.
דוגמה: אני מקצה את המספרים 1 עד 500 לחברות ב-S&P 500 לפי סדר אלפביתי של המנכ"ל הנוכחי, כאשר החברה הראשונה מקבלת את הערך '1' והחברה האחרונה מקבלת את הערך '500'.
שלב 5: בחר ערכים אקראיים
בשלב 2, בחרנו את מספר הפריטים שרצינו לנתח בתוך האוכלוסייה שלנו. עבור הדוגמה הרצה, אנו בוחרים לנתח 20 פריטים. בשלב החמישי, אנו בוחרים באקראי 20 מספרים מהערכים שהוקצו למשתנים שלנו. בדוגמה הפועלת, זהו המספרים 1 עד 500. ישנן מספר דרכים לבחור באקראי את 20 המספרים הללו שנדונו בהמשך מאמר זה.
דוגמה: באמצעות טבלת המספרים האקראיים, אני בוחר את המספרים 2, 7, 17, 67, 68, 75, 77, 87, 92, 101, 145, 201, 222, 232, 311, 333, 376, 4801, 47, ו-489.
שלב 6: זיהוי מדגם
השלב האחרון של מדגם אקראי פשוט הוא שלב הגשר 4 ושלב 5. כל אחד מהמשתנים האקראיים שנבחרו בשלב הקודם מתאים לפריט באוכלוסיה שלנו. המדגם נבחר על ידי זיהוי אילו ערכים אקראיים נבחרו ואילו פריטי אוכלוסיה מתאימים.
דוגמה: המדגם שלי מורכב מהפריט השני ברשימת החברות הרשומות אלפביתי לפי שם המשפחה של המנכ"ל. המדגם שלי מורכב גם מחברה מספר 7, 17, 67 וכו'.
טכניקות דגימה אקראית
אין שיטה אחת לקביעת הערכים האקראיים שייבחרו (כלומר שלב 5 לעיל). האנליטיקאי לא יכול פשוט לבחור מספרים באקראי מכיוון שייתכן שלא תהיה אקראיות עם מספרים. לדוגמה, יום הנישואין של האנליטיקאי עשוי להיות ה-24, כך שהם עשויים לבחור במודע (או בתת מודע) את הערך האקראי 24. במקום זאת, האנליטיקאי יכול לבחור באחת מהשיטות הבאות:
פשוט אקראי לעומת שיטות דגימה אחרות
מדגם אקראי פשוט לעומת מדגם אקראי שכוב
מדגם אקראי פשוט משמש כדי לייצג את כל אוכלוסיית הנתונים. מדגם אקראי משובץ מחלק את האוכלוסייה לקבוצות קטנות יותר, או שכבות, על סמך מאפיינים משותפים.
שלא כמו דגימות אקראיות פשוטות, דגימות אקראיות מרובדות משמשות עם אוכלוסיות שניתן לחלק בקלות לתת-קבוצות או תת-קבוצות שונות. קבוצות אלו מבוססות על קריטריונים מסוימים, ואז רכיבים מכל אחת נבחרים באופן אקראי ביחס לגודל הקבוצה לעומת האוכלוסייה. בדוגמה שלנו למעלה, חברות S&P 500 יכלו לפרוץ לאזור גיאוגרפי או תעשייה של המטה.
שיטת הדגימה הזו פירושה שיהיו סלקציות מכל קבוצה אחרת – שגודלה מבוסס על היחס שלה לכלל האוכלוסייה. על החוקרים לוודא שהשכבות אינן חופפות. כל נקודה באוכלוסיה חייבת להשתייך לשכבה אחת בלבד ולכן כל נקודה סותרת זו את זו. שכבות חופפות יגדילו את הסבירות שחלק מהנתונים נכללים, ובכך ישטטו את המדגם.
פשוט אקראי לעומת דגימה שיטתית
דגימה שיטתית גורמת לבחירת משתנה אקראי בודד, והמשתנה הזה קובע את הפנימיות שבה נבחרים פריטי האוכלוסייה. לדוגמה, אם המספר 37 נבחר, החברה ה-37 ברשימה ממוינת לפי שם משפחה של המנכ"ל תיבחר על ידי המדגם. לאחר מכן, ה-74 (כלומר ה-37 הבא) וה-111 (כלומר ה-37 הבא אחריו) יתווספו גם כן.
לדגימה אקראית פשוטה אין נקודת התחלה; לכן, קיים סיכון שפריטי האוכלוסייה שנבחרו באקראי עשויים להתקבץ. בדוגמה שלנו, יכול להיות שיש שפע של מנכ"לים עם שם המשפחה שמתחיל באות 'F'. דגימה שיטתית שואפת לצמצם עוד יותר את ההטיה כדי להבטיח שהאשכולות האלה לא יתרחשו.
פשוט אקראי לעומת דגימת אשכולות
דגימת אשכולות יכולה להתרחש כאשכול חד-שלבי או כאשכול דו-שלבי. באשכול חד-שלבי, פריטים בתוך אוכלוסייה מוכנסים לקבוצות דומות; באמצעות הדוגמה שלנו, חברות מקובצות לפי שנה שנוצרה. לאחר מכן, הדגימה מתרחשת בתוך אשכולות אלה.
דגימת אשכולות דו-שלבית מתרחשת כאשר אשכולות נוצרים באמצעות בחירה אקראית. האוכלוסייה אינה מקובצת עם פריטים דומים אחרים. לאחר מכן, פריטים לדוגמה נבחרים באקראי בתוך כל אשכול.
דגימה אקראית פשוטה אינה מקבצת קבוצות אוכלוסייה כלשהן. למרות שדגימה אקראית מדגימה עשויה להיות פשוטה יותר, מקבץ (במיוחד מקבץ דו-שלבי) עשוי לשפר את האקראיות של פריטי מדגם. בנוסף, דגימת אשכולות עשויה לספק ניתוח מעמיק יותר על תמונת מצב ספציפית של אוכלוסייה אשר עשויה לשפר את הניתוח או לא.
יתרונות וחסרונות של דגימות אקראיות פשוטות
בעוד שדגימות אקראיות פשוטות קלות לשימוש, הן מגיעות עם חסרונות עיקריים שיכולים להפוך את הנתונים לחסרי תועלת.
היתרונות של מדגם אקראי פשוט
קלות השימוש מייצגת את היתרון הגדול ביותר של דגימה אקראית פשוטה. בניגוד לשיטות דגימה מסובכות יותר, כגון דגימה אקראית מרובדת ודגימת הסתברות, אין צורך לחלק את האוכלוסייה לתת-אוכלוסיות או לנקוט בצעדים נוספים לפני בחירת חברי האוכלוסייה באקראי.
מדגם אקראי פשוט נועד להיות ייצוג חסר פניות של קבוצה. זו נחשבת דרך הוגנת לבחור מדגם מאוכלוסיה גדולה יותר שכן לכל אחד מבני האוכלוסייה יש סיכוי שווה להיבחר. לכן, דגימה אקראית פשוטה ידועה באקראיות שלה ופחות סיכוי להטיית דגימה.
חסרונות של Simple Random Sample
טעות דגימה יכולה להתרחש עם מדגם אקראי פשוט אם המדגם לא משקף בסופו של דבר במדויק את האוכלוסייה שהוא אמור לייצג. לדוגמה, במדגם האקראי הפשוט שלנו של 25 עובדים, ניתן יהיה לצייר 25 גברים גם אם האוכלוסייה מורכבת מ-125 נשים, 125 גברים ו-125 אנשים לא בינאריים.
מסיבה זו, דגימה אקראית פשוטה משמשת יותר כאשר החוקר יודע מעט על האוכלוסייה. אם החוקר ידע יותר, עדיף היה להשתמש בטכניקת דגימה אחרת, כמו דגימה אקראית מרובדת, שעוזרת להסביר את ההבדלים בתוך האוכלוסייה, כגון גיל, גזע או מין.
חסרונות נוספים כוללים את העובדה שעבור דגימה מאוכלוסיות גדולות, התהליך עשוי להיות ארוך ויקר בהשוואה לשיטות אחרות. חוקרים עשויים למצוא שפרויקט מסוים אינו שווה את המאמץ של ניתוח עלות-תועלת שלו אינו מניב תוצאות חיוביות. מכיוון שלכל יחידה יש להקצות מספר מזהה או רציף לפני תהליך הבחירה, משימה זו עשויה להיות קשה בהתבסס על שיטת איסוף הנתונים או גודל מערך הנתונים.
דגימה אקראית פשוטה
יתרונות
חסרונות
מדוע מדגם אקראי פשוט הוא פשוט?
אין שיטה קלה יותר להוציא מדגם מחקר מאוכלוסיה גדולה יותר מאשר דגימה אקראית פשוטה. בחירת מספיק נושאים באופן אקראי לחלוטין מהאוכלוסייה הגדולה יותר מניבה גם מדגם שיכול להיות מייצג של הקבוצה הנחקרת.
מהם החסרונות של מדגם אקראי פשוט?
בין החסרונות של טכניקה זו ניתן למצוא קושי להשיג גישה למשיבים שניתן למשוך מהאוכלוסייה הגדולה יותר, זמן רב יותר, עלויות גדולות יותר והעובדה שהטיה עדיין יכולה להתרחש בנסיבות מסוימות.
מהו דגימה אקראית מרובדת?
מדגם אקראי שכבות, בניגוד להגרלה פשוטה, מחלק תחילה את האוכלוסייה לקבוצות קטנות יותר, או שכבות, על סמך מאפיינים משותפים. לכן, אסטרטגיית דגימה מרובדת תבטיח שחברים מכל תת-קבוצה ייכללו בניתוח הנתונים. דגימה מרובדת משמשת כדי להדגיש הבדלים בין קבוצות באוכלוסייה, בניגוד לדגימה אקראית פשוטה, המתייחסת לכל חברי האוכלוסייה כשווים, עם סבירות שווה להידגמים.
כיצד משתמשים בדגימות אקראיות?
שימוש בדגימה אקראית פשוטה מאפשר לחוקרים לעשות הכללות לגבי אוכלוסייה ספציפית ולהשאיר כל הטיה. באמצעות טכניקות סטטיסטיות, ניתן להסיק מסקנות ותחזיות לגבי האוכלוסייה ללא צורך בסקר או לאסוף נתונים מכל פרט באוכלוסייה זו.
סיכום ומסקנות
כאשר מנתחים אוכלוסייה, דגימה אקראית פשוטה היא טכניקה שמביאה לכך שלכל פריט באוכלוסיה יש אותה הסתברות להיבחר עבור גודל המדגם. ניתן להרחיב צורה בסיסית יותר זו של דגימה כדי להפיק שיטות דגימה מסובכות יותר. עם זאת, תהליך יצירת רשימה של כל הפריטים באוכלוסייה, הקצאת לכל אחד מהם מספר רציף, בחירת גודל המדגם ובחירה אקראית של פריטים היא צורה בסיסית יותר של בחירת יחידות לניתוח.