מהו ניתוח שונות (ANOVA)?
מהו ניתוח שונות (ANOVA)? ניתוח שונות (ANOVA) הוא כלי ניתוח המשמש בסטטיסטיקה המחלק את השונות המצטברת הנצפית שנמצאת בתוך מערך נתונים לשני חלקים: גורמים שיטתיים וגורמים אקראיים. לגורמים השיטתיים יש השפעה סטטיסטית על מערך הנתונים הנתון, ואילו לגורמים האקראיים אין. אנליסטים משתמשים במבחן ANOVA כדי לקבוע את ההשפעה שיש למשתנים בלתי תלויים על המשתנה התלוי במחקר רגרסיה. שיטות ה-t-andz-test שפותחו במאה ה-20 שימשו לניתוח סטטיסטי עד 1918, כאשר רונלד פישר יצר את שיטת ניתוח השונות. ANOVA נקראת גם ניתוח השונות של פישר, והיא ההרחבה של ה-t-ו-z -בדיקות. המונח התפרסם בשנת 1925, לאחר שהופיע בספרו של פישר, "שיטות סטטיסטיות לעובדי מחקר". הוא הועסק בפסיכולוגיה ניסויית ומאוחר יותר התרחב לנושאים שהיו מורכבים יותר.
מהו ניתוח שונות (ANOVA)? – שיטות ה-t-andz-test שפותחו במאה ה-20 שימשו לניתוח סטטיסטי עד 1918, כאשר רונלד פישר יצר את שיטת ניתוח השונות. ANOVA נקראת גם ניתוח השונות של פישר, והיא ההרחבה של ה-t-ו-z -בדיקות. המונח התפרסם בשנת 1925, לאחר שהופיע בספרו של פישר, "שיטות סטטיסטיות לעובדי מחקר". הוא הועסק בפסיכולוגיה ניסויית ומאוחר יותר התרחב לנושאים שהיו מורכבים יותר.
מהו ניתוח שונות (ANOVA)? – נקודות מרכזיות
1:01
מהו ניתוח השונות (ANOVA)?
מה מגלה ניתוח השונות?
מבחן ANOVA הוא השלב הראשוני בניתוח גורמים המשפיעים על סט נתונים נתון. לאחר סיום הבדיקה, אנליסט מבצע בדיקות נוספות על הגורמים המתודיים התורמים באופן מדיד לחוסר העקביות של מערך הנתונים. האנליסט משתמש בתוצאות מבחן ANOVA במבחן f כדי ליצור נתונים נוספים המתיישרים עם מודל הרגרסיה המוצע.
מבחן ANOVA מאפשר השוואה של יותר משתי קבוצות בו זמנית כדי לקבוע האם קיים קשר ביניהן. התוצאה של נוסחת ANOVA, סטטיסטיקת F (נקראת גם F-ratio), מאפשרת ניתוח של מספר קבוצות של נתונים כדי לקבוע את השונות בין דגימות ובתוך דגימות.
אם לא קיים הבדל ממשי בין הקבוצות שנבדקו, מה שנקרא השערה מלאה, התוצאה של סטטיסטיקת F-ratio של ANOVA תהיה קרובה ל-1. ההתפלגות של כל הערכים האפשריים של סטטיסטיקת F היא התפלגות F. זוהי למעשה קבוצה של פונקציות התפלגות, עם שני מספרים אופייניים, הנקראים דרגות החופש המכנה והמכנה דרגות החופש.
דוגמה לשימוש ב-ANOVA
חוקר עשוי, למשל, לבחון סטודנטים ממכללות מרובות כדי לראות אם סטודנטים מאחת המכללות עולות באופן עקבי על סטודנטים מהמכללות האחרות. ביישום עסקי, חוקר מו"פ עשוי לבדוק שני תהליכים שונים של יצירת מוצר כדי לראות אם תהליך אחד טוב יותר מהאחר מבחינת יעילות עלות.
סוג מבחן ANOVA בו נעשה שימוש תלוי במספר גורמים. הוא מיושם כאשר הנתונים צריכים להיות ניסיוניים. ניתוח השונות מופעל אם אין גישה לתוכנה סטטיסטית וכתוצאה מכך מחשוב ANOVA ביד. זה פשוט לשימוש ומתאים ביותר לדוגמאות קטנות. עם עיצובים ניסיוניים רבים, גדלי המדגם צריכים להיות זהים עבור שילובי רמת הגורמים השונים.
ANOVA מועילה לבדיקת שלושה משתנים או יותר. זה דומה לבדיקות מרובות של שתי דגימות. עם זאת, התוצאה היא פחות שגיאות מסוג I ומתאים למגוון בעיות. ANOVA מקבץ הבדלים על ידי השוואת האמצעים של כל קבוצה וכוללת פיזור השונות למקורות מגוונים. הוא מועסק עם נושאים, קבוצות מבחן, בין קבוצות ובתוך קבוצות.
ANOVA חד כיווני מול ANOVA דו כיווני
ישנם שני סוגים עיקריים של ANOVA: חד כיווני (או חד כיווני) ודו כיווני. יש גם וריאציות של ANOVA. לדוגמה, MANOVA (ANOVA מרובה) שונה מ-ANOVA מכיוון שהראשונים בודקים מספר משתנים תלויים בו-זמנית בעוד שהאחרון מעריך רק משתנה תלוי אחד בכל פעם. חד כיווני או דו כיווני מתייחס למספר המשתנים הבלתי תלויים במבחן ניתוח השונות שלך. ANOVA חד כיווני מעריך את ההשפעה של גורם יחיד על משתנה תגובה יחיד. זה קובע אם כל הדגימות זהות. ה-ANOVA החד-כיווני משמש כדי לקבוע אם יש הבדלים מובהקים סטטיסטית בין הממוצעים של שלוש או יותר קבוצות עצמאיות (לא קשורות).
ANOVA דו כיווני היא הרחבה של ANOVA חד כיוונית. עם חד כיווני, יש לך משתנה אחד בלתי תלוי המשפיע על משתנה תלוי. עם ANOVA דו-כיווני, יש שני עצמאיים. לדוגמה, ANOVA דו-כיווני מאפשר לחברה להשוות את תפוקת העובדים על סמך שני משתנים בלתי תלויים, כגון שכר ומערך מיומנויות. הוא מנוצל כדי לצפות באינטראקציה בין שני הגורמים ובודק את ההשפעה של שני גורמים בו זמנית.