מהו מבחן דו-זנב?
מהו מבחן דו-זנב? מבחן דו-זנב, בסטטיסטיקה, הוא שיטה שבה האזור הקריטי של התפלגות הוא דו-צדדי ובודק האם מדגם גדול או קטן מטווח מסוים של ערכים. הוא משמש השערה פנימית לבדיקה ובדיקה של מובהקות סטטיסטית. אם המדגם הנבדק נופל לאחד מהאזורים הקריטיים, ההשערה החלופית תתקבל במקום השערת האפס.
מהו מבחן דו-זנב? – נקודות מרכזיות
הבנת מבחן דו-זנבתי
מושג בסיסי של סטטיסטיקה מסקנת היא בדיקת היפותזה, הקובעת אם טענה נכונה או לא בהינתן פרמטר אוכלוסייה. מבחן השערה שנועד להראות אם הממוצע של מדגם גדול משמעותית מהממוצע של אוכלוסייה וקטן משמעותית מהממוצע של אוכלוסייה מכונה מבחן דו-זנבתי. הבדיקה הדו-זנבית מקבלת את שמה מבדיקת השטח מתחת לשני זנבות ההתפלגות החריגה, אם כי ניתן להשתמש בבדיקה בהתפלגויות אחרות שאינן נורמליות.
מבחן דו-צדדי נועד לבחון את שני הצדדים של טווח נתונים מוגדר כפי שמסומן על ידי התפלגות ההסתברות המעורבת. התפלגות ההסתברות צריכה לייצג את הסבירות לתוצאה מוגדרת בהתבסס על סטנדרטים שנקבעו מראש. הדבר מחייב הגדרת גבול המציין את ערכי המשתנים הגבוהים ביותר (או העליונים) והנמוכים ביותר (או הנמוכים ביותר) המקובלים הכלולים בטווח. כל נקודת נתונים שקיימת מעל הגבול העליון או מתחת לגבול התחתון נחשבת מחוץ לטווח הקבלה ובאזור המכונה טווח הדחייה.
אין תקן מובנה לגבי מספר נקודות הנתונים שצריכות להתקיים בטווח הקבלה. במקרים בהם נדרש דיוק, כגון ביצירת תרופות פרמצבטיות, ניתן להפעיל שיעור דחייה של 0.001% או פחות. במקרים בהם הדיוק פחות קריטי, כמו מספר פריטי המזון בשקית המוצר, עשוי להיות מתאים שיעור דחייה של 5%.
נסיבות ייחודיות
מבחן דו-זנב יכול לשמש באופן מעשי גם במהלך פעילויות ייצור מסוימות בחברה, כמו ייצור ואריזה של ממתקים במתקן מסוים. אם מתקן הייצור מייעד 50 סוכריות לשקית כמטרה, עם חלוקה מקובלת של 45 עד 55 סוכריות, כל שקית שנמצאה עם כמות מתחת ל-45 או מעל 55 נחשבת בטווח הדחייה.
כדי לוודא שמנגנוני האריזה מכוילים כראוי כדי לעמוד בתפוקה הצפויה, ניתן לבצע דגימה אקראית כדי לאשר את הדיוק. מדגם אקראי פשוט לוקח חלק קטן ואקראי של כל האוכלוסייה כדי לייצג את כל מערך הנתונים, כאשר לכל חבר יש הסתברות שווה להיבחר.
כדי שמנגנוני האריזה ייחשבו מדויקים, רצוי 50 סוכריות בממוצע לשקית בחלוקה מתאימה. בנוסף, מספר השקיות הנופלות בטווח הדחייה צריך ליפול בתוך מגבלת התפלגות ההסתברות הנחשבת כמקובלת כשיעור שגיאה. כאן, השערת האפס תהיה שהממוצע הוא 50 בעוד שההשערה החלופית תהיה שזה לא 50.
אם לאחר ביצוע הבדיקה הדו-זנבית, ה-z-score יורד באזור הדחייה, כלומר הסטייה רחוקה מדי מהממוצע הרצוי, ייתכן שיידרשו התאמות של המתקן או הציוד הנלווה כדי לתקן את השגיאה. שימוש קבוע בשיטות בדיקה דו זנבות יכול לעזור להבטיח הייצור נשאר בגבולות לטווח הארוך.
מבחן דו-זנב לעומת חד-זנב
כאשר מבחן השערה מוגדר כדי להראות שממוצע המדגם יהיה גבוה או נמוך מממוצע האוכלוסייה, זה מכונה מבחן חד-זנב. המבחן החד-זנבי מקבל את שמה מבדיקת השטח מתחת לאחד מהזנבות (הצדדים) של התפלגות נורמלית. כאשר משתמשים במבחן חד-זנב, אנליטיקאי בודק את האפשרות של קשר לכיוון אחד של עניין, ומתעלם לחלוטין מהאפשרות של קשר בכיוון אחר.
אם המדגם הנבדק נופל לאזור הקריטי החד-צדדי, ההשערה החלופית תתקבל במקום השערת האפס. מבחן חד-זנב ידוע גם כהשערה כיוונית או מבחן כיווני.
מבחן דו-זנב, לעומת זאת, נועד לבחון את שני הצדדים של טווח נתונים מוגדר כדי לבדוק אם מדגם גדול או קטן מטווח הערכים.
דוגמה למבחן דו-זנבתי
כדוגמה היפותטית, תארו לעצמכם שברוקר חדש, בשם XYZ, טוען שעמלות התיווך שלו נמוכות מאלו של מתווך המניות הנוכחי שלכם, ABC. נתונים זמינים מחברת מחקר עצמאית מצביעים על כך שהממוצע וסטיית התקן של כל לקוחות הברוקר של ABC הם $18 ו-$6, בהתאמה.
נלקח מדגם של 100 לקוחות של ABC, ודמי התיווך מחושבים עם התעריפים החדשים של ברוקר XYZ. אם הממוצע של המדגם הוא 18.75$ וסטיית התקן המדגם היא 6$, האם ניתן להסיק על ההבדל בחשבון התיווך הממוצע בין ברוקר ABC ל-XYZ?
ערך Z מחושב זה נופל בין שני הגבולות המוגדרים על ידי: – Z2.5= -1.96 ו- Z2.5= 1.96.
זה מסיק שאין מספיק ראיות כדי להסיק שיש הבדל כלשהו בין התעריפים של הברוקר הקיים שלך לבין הברוקר החדש. לכן, לא ניתן לדחות את השערת האפס. לחלופין, ערך p = P(Z< -1.25)+P(Z >1.25) = 2 * 0.1056 = 0.2112 = 21.12%, שהוא גדול מ-0.05 או 5%, מוביל לאותה מסקנה.
כיצד מתוכנן מבחן דו-זנבתי?
מבחן דו-צדדי נועד לקבוע אם טענה נכונה או לא בהינתן פרמטר אוכלוסייה. הוא בוחן את שני הצדדים של טווח נתונים מוגדר כפי שמסומן על ידי התפלגות ההסתברות המעורבת. ככזה, התפלגות ההסתברות צריכה לייצג את הסבירות לתוצאה מוגדרת בהתבסס על סטנדרטים שנקבעו מראש.
מה ההבדל בין מבחן דו-זנב לאחד-זנב?
מבחן השערה דו-זנבתי נועד להראות אם ממוצע המדגם גדול משמעותית מממוצע האוכלוסייה וקטן משמעותית מהממוצע של אוכלוסייה. מבחן הדו-זנב מקבל את שמה מבדיקת השטח מתחת לשני הזנבות (הצדדים) של התפלגות נורמלית. מבחן השערה חד-זנב, לעומת זאת, מוגדר כדי להראות שממוצע המדגם יהיה גבוה או נמוך מממוצע האוכלוסייה.
מהו ציון Z?
ציון Z מתאר באופן מספרי את הקשר של ערך לממוצע של קבוצת ערכים ונמדד במונחים של מספר סטיות התקן מהממוצע. אם ציון Z הוא 0, זה מציין שהציון של נקודת הנתונים זהה לציון הממוצע בעוד שציוני Z של 1.0 ו-1.0 יצביעו על ערכים סטיית תקן אחת מעל או מתחת לממוצע. ברוב מערכי הנתונים הגדולים, ל-99% מהערכים יש ציון Z בין -3 ל-3, כלומר הם נמצאים בתוך שלוש סטיות תקן מעל ומתחת לממוצע.