מה זה כושר גופני?
מה זה כושר גופני? המונח התאמה טובה מתייחס למבחן סטטיסטי הקובע עד כמה נתוני המדגם מתאימים להתפלגות מאוכלוסיה עם התפלגות חריגה. במילים פשוטות, הוא מעלה השערה אם מדגם מוטה או מייצג את הנתונים שהייתם מצפים למצוא באוכלוסייה בפועל. התאמה טובה קובעת את הפער בין הערכים הנצפים לאלו הצפויים מהמודל במקרה של התפלגות נורמלית. ישנן מספר שיטות לקביעת מידת ההתאמה, כולל הצ'י ריבוע.
מה זה כושר גופני? – התאמה טובה קובעת את הפער בין הערכים הנצפים לאלו הצפויים מהמודל במקרה של התפלגות נורמלית. ישנן מספר שיטות לקביעת מידת ההתאמה, כולל הצ'י ריבוע.
מה זה כושר גופני? – נקודות מרכזיות
הבנת Goodness-of-Fit
מבחני התאמה הן שיטות סטטיסטיות שמסיקות לגבי ערכים נצפים. לדוגמה, אתה יכול לקבוע אם קבוצת מדגם מייצגת באמת את כל האוכלוסייה. ככאלה, הם קובעים כיצד ערכים בפועל קשורים לערכים החזויים במודל. כשמשתמשים בהם בקבלת החלטות, מבחני התאמה טובים מקלים על חיזוי מגמות ודפוסים בעתיד.
כפי שצוין לעיל, ישנם מספר סוגים של מבחני התאמה. הם כוללים את מבחן הצ'י ריבוע, שהוא הנפוץ ביותר, וכן את מבחן קולמוגורוב-סמירנוב ומבחן שפירו-וילק. הבדיקות מתבצעות בדרך כלל באמצעות תוכנת מחשב. אבל סטטיסטיקאים יכולים לעשות את הבדיקות הללו באמצעות נוסחאות המותאמות לסוג הבדיקה הספציפי.
כדי לערוך את הבדיקה, צריך משתנה מסוים, יחד עם הנחה כיצד הוא מתחלק. אתה גם צריך מערך נתונים עם ערכים ברורים ומפורשים, כגון:
הקמת רמת אלפא
על מנת לפרש מבחן התאמה, חשוב לסטטיסטיקאים לקבוע רמת אלפא, כגון ערך ה-p עבור מבחן הצ'י ריבוע. ערך p מתייחס להסתברות לקבל תוצאות קרובות לקיצוניות של התוצאות שנצפו. זה מניח שההשערה המלאה נכונה. השערת אפס טוענת שאין קשר בין משתנים, וההשערה החלופית מניחה שקיים קשר.
במקום זאת, תדירות הערכים הנצפים נמדדת ולאחר מכן בשימוש עם הערכים הצפויים ודרגות החופש לחישוב צ'י ריבוע. אם התוצאה נמוכה מאלפא, השערת האפס אינה חוקית, מה שמעיד על קשר בין המשתנים.
סוגי בדיקות כושר
מבחן צ'י ריבוע
χ2=∑i=1k(Oi−Ei)2/Ei\chi^2=\sum\limits^k_{i=1}(O_i-E_i)^2/E_iχ2=i=1∑k(Oi− Ei)2/Ei
מבחן תצ'י ריבוע, המכונה גם מבחן צ'י ריבוע לעצמאות, הוא שיטת סטטיסטיקה מסקנת הבודקת את תקפותה של טענה שהועלתה על אוכלוסייה על סמך מדגם אקראי.
בשימוש בלעדי עבור נתונים המופרדים למחלקות (פחים), הוא דורש גודל מדגם מספיק כדי להפיק תוצאות מדויקות. אבל זה לא מעיד על סוג או עוצמת הקשר. למשל, זה לא מסיק אם הקשר חיובי או שלילי.
כדי לחשב התאמה טובה של צ'י ריבוע, הגדר את רמת המשמעות הרצויה של אלפא. אז אם רמת הביטחון שלך היא 95% (או 0.95), אז האלפא הוא 0.05. לאחר מכן, זהה את המשתנים הקטגוריים לבדיקה, ואז הגדירו הצהרות השערות לגבי הקשרים ביניהם.
מבחן קולמוגורוב-סמירנוב (ק-ש).
D=max1≤i≤N(F(Yi)−i−1N,iN−F(Yi))D=\max\limits_{1\leq i\leq N}\bigg(F(Y_i)-\ frac{i-1}{N},\frac{i}{N}-F(Y_i)\bigg)D=1≤i≤Nmax(F(Yi)−Ni−1,Ni−F (יי))
על שם המתמטיקאים הרוסים אנדריי קולמוגורוב וניקולאי סמירנוב, מבחן קולמוגורוב-סמירנוב (K-S) הוא שיטה סטטיסטית שקובעת אם המדגם הוא מהתפלגות ספציפית בתוך אוכלוסייה.
בדיקה זו, המומלצת לדגימות גדולות (למשל, מעל 2000), אינה פרמטרית. זה אומר שהוא לא מסתמך על שום הפצה כדי להיות תקפה. המטרה היא להוכיח את השערת האפס, שהיא המדגם של ההתפלגות הנורמלית.
כמו צ'י ריבוע, הוא משתמש בהשערת אפס וחלופית וברמת אלפא של מובהקות. Null מציין שהנתונים עוקבים אחר התפלגות ספציפית בתוך האוכלוסייה, וחלופה מציינת שהנתונים לא עקבו אחר התפלגות ספציפית בתוך האוכלוסייה. האלפא משמש לקביעת הערך הקריטי המשמש בבדיקה. אבל בניגוד למבחן הצ'י ריבוע, מבחן קולמוגורוב-סמירנוב חל על התפלגויות רציפות.
נתון המבחן המחושב מסומן לעתים קרובות כ-D. הוא קובע אם השערת האפס מתקבלת או נדחית. אם D גדול מהערך הקריטי atalpha, השערת האפס נדחית. אם D קטן מהערך הקריטי, השערת האפס מתקבלת.
מבחן אנדרסון-דארלינג (א-ד).
S=∑i=1N(2i−1)N[lnF(Yi)+ln(1−F(YN+1−i))]S = \sum_{i = 1}^{N} \frac {( 2i – 1 )}{ N } [\ln F ( Y_i ) + \ln ( 1 – F ( Y_{N + 1 – i} ) ) ]S=∑i=1NN(2i−1) [lnF(Yi)+ln(1−F(YN+1−i))]
מבחן אנדרסון-דארלינג (A-D) הוא וריאציה על מבחן K-S, אך נותן משקל רב יותר לזנבות ההתפלגות. מבחן K-S רגיש יותר להבדלים שעלולים להתרחש קרוב יותר למרכז ההתפלגות, בעוד מבחן A-D רגיש יותר לשונות שנצפו בזנבות. מכיוון שסיכון זנב והרעיון של "זנבות שומניים" רווחים בשווקים הפיננסיים, מבחן A-D יכול לתת יותר כוח בניתוחים פיננסיים.
כמו מבחן K-S, מבחן A-D מייצר נתון, המסומן כ-A2, אותו ניתן להשוות מול השערת האפס.
מבחן שפירו-וילק (S-W).
W=(∑i=1nai(x(i))2∑i=1n(xi−xˉ)2,W=\frac{\big(\sum^n_{i=1}a_i(x_{(i)} \big)^2}{\sum^n_{i=1}(x_i-\bar{x})^2},W=∑i=1n(xi−xˉ)2(∑i=1nai (x(i))2,
בדיקת Shapiro-Wilk (S-W) קובעת אם מדגם עוקב אחר התפלגות נורמלית. הבדיקה בודקת תקינות רק כאשר משתמשים במדגם עם משתנה אחד של נתונים רציפים ומומלצת לגדלים קטנים של מדגם עד 2000.
מבחן Shapiro-Wilk משתמש במגרש הסתברות הנקרא QQ Plot, המציגה שתי קבוצות של קוונטילים על ציר ה-y המסודרים מהקטן לגדול ביותר. אם כל קוונטיל הגיע מאותה התפלגות, סדרת החלקות היא ליניארית.
עלילת QQ משמשת להערכת השונות. באמצעות שונות עלילת QQ יחד עם השונות המשוערת של האוכלוסייה, ניתן לקבוע אם המדגם שייך להתפלגות נורמלית. אם המנה של שתי השונות שווה או קרובה ל-1, ניתן לקבל את השערת האפס. אם נמוך משמעותית מ-1, ניתן לדחות אותו.
בדיוק כמו המבחנים שהוזכרו לעיל, המבחן הזה משתמש באלפא ויוצר שתי השערות: ריק וחלופה. השערת האפס קובעת שהמדגם מגיע מההתפלגות הנורמלית, בעוד שההשערה החלופית קובעת שהמדגם אינו מגיע מההתפלגות הנורמלית.
בדיקות התאמה אחרות
מלבד הסוגים הנפוצים יותר של מבחנים שהוזכרו לעיל, ישנם מבחנים רבים אחרים שבהם אנליסט יכול להשתמש:
החשיבות של מבחני כושר
מבחני התאמה חשובים בסטטיסטיקה מסיבות רבות. ראשית, הם מספקים דרך להעריך עד כמה מודל סטטיסטי מתאים לקבוצה של נתונים שנצפו. החשיבות העיקרית של הפעלת מבחן התאמה היא לקבוע אם הנתונים הנצפים תואמים את המודל הסטטיסטי המשוער. בהרחבה, בדיקת תקינות עשויה להיות שימושית בבחירה בין מודלים שונים שעשויים להתאים יותר לנתונים. מבחני התאמה יכולים גם לעזור לזהות חריגים או חריגות בשוק שעשויות להשפיע על ההתאמה של המודל. לחריגות עשויות להיות השפעה רבה על התאמת הדגם וייתכן שיהיה צורך להסירן או לטפל בהן בנפרד. לפעמים, לא ניתן לזהות בקלות חריגים עד שהם משולבים במודל אנליטי. מבחני התאמה יכולים גם לספק מידע על השונות של הנתונים והפרמטרים המשוערים של המודל. מידע זה יכול להיות שימושי לביצוע תחזיות והבנת ההתנהגות של המערכת המעצבת. בהתבסס על הנתונים המוזנים למודל, ייתכן שיהיה צורך לחדד את המודל הספציפי למערך הנתונים הנבדק, את השאריות המחושבות ואת ערך ה-p עבור נתונים שעלולים להיות קיצוניים.
מבחן כושר טוב לעומת מבחן עצמאות
מבחן התאמה ומבחן עצמאות שניהם מבחנים סטטיסטיים המשמשים להערכת הקשר בין משתנים; לכן, קל לבלבל בין השניים. עם זאת, כל אחת מהן נועדה לענות על שאלות שונות. מבחן טוב-של-התאמה משמש כדי להעריך עד כמה קבוצה של נתונים שנצפו מתאימה להתפלגות הסתברות מסוימת. מצד שני, מבחן עצמאות משמש להערכת הקשר בין שני משתנים. הוא משמש כדי לבדוק אם יש קשר בין שני משתנים. המטרה העיקרית של מבחן עצמאות היא לראות האם שינוי במשתנה אחד קשור לשינוי במשתנה אחר. מבחן עצמאות משמש בדרך כלל כאשר שאלת המחקר מתמקדת בהבנת הקשר בין שני משתנים והאם הם קשורים או קשורים עצמאי. במקרים רבים, בדיקת עצמאות מכוונת לשני משתנים ספציפיים (כלומר האם עישון גורם לסרטן ריאות?). מצד שני, נעשה שימוש במבחן כושר גופני על סט שלם של נתונים שנצפו כדי להעריך את מידת ההתאמה של מודל ספציפי.
דוגמה לכושר כושר
הנה דוגמה היפותטית כדי להראות כיצד פועל מבחן הכושר. נניח שחדר כושר קהילתי קטן פועל תחת ההנחה שהנוכחות הגבוהה ביותר היא בימי שני, שלישי ושבת, נוכחות ממוצעת בימי רביעי וחמישי, והנוכחות הנמוכה ביותר בימי שני, שלישי ושבת. ימי שישי וראשון. בהתבסס על הנחות אלו, חדר הכושר מעסיק מספר מסוים של אנשי צוות בכל יום כדי לבצע צ'ק אין חברים, לנקות מתקנים, להציע שירותי אימון ולהעביר שיעורים. אבל חדר הכושר לא מתפקד טוב מבחינה כלכלית והבעלים רוצה לדעת אם נוכחות אלה ההנחות ורמות האיוש נכונות. הבעלים מחליט לספור את מספר המשתתפים בחדר הכושר בכל יום במשך שישה שבועות. לאחר מכן הם יכולים להשוות את הנוכחות המשוערת של חדר הכושר עם הנוכחות הנצפית שלו באמצעות מבחן כושר גופני מרובע צ'י למשל. כעת, לאחר שיש להם את הנתונים החדשים, הם יכולים לקבוע כיצד לנהל את חדר הכושר בצורה הטובה ביותר ולשפר את הרווחיות.
מה האם כושר טוב אומר?
Goodness-of-Fit הוא מבחן השערה סטטיסטית המשמש כדי לראות כיצד נתונים שנצפו מקרוב משקפים נתונים צפויים. מבחני כושר גופני יכולים לעזור לקבוע אם מדגם עוקב אחר התפלגות נורמלית, אם משתנים קטגוריים קשורים, או אם מדגמים אקראיים הם מאותה התפלגות.
מדוע כושר התאמה חשוב?
מבחני כושר גופני עוזרים לקבוע אם הנתונים שנצפו עולים בקנה אחד עם הצפוי. ניתן לקבל החלטות על סמך תוצאת מבחן ההשערה שנערך. לדוגמה, קמעונאי רוצה לדעת איזה מוצר מושך צעירים. הקמעונאי סוקר מדגם אקראי של אנשים מבוגרים וצעירים כדי לזהות איזה מוצר מועדף. באמצעות צ'י ריבוע, הם מזהים שעם 95% ביטחון קיים קשר בין מוצר A לצעירים. בהתבסס על תוצאות אלו, ניתן לקבוע כי מדגם זה מייצג את אוכלוסיית המבוגרים הצעירים. משווקים קמעונאיים יכולים להשתמש בזה כדי לתקן את מסעות הפרסום שלהם.
מהו כושר גופני במבחן הצ'י-סקוור?
ה-chi-square בודק האם קיימים קשרים בין משתנים קטגוריים והאם המדגם מייצג את השלם. הוא מעריך עד כמה הנתונים שנצפו משקפים את הנתונים הצפויים, או עד כמה הם מתאימים.
כיצד עושים את מבחן הכושר הטוב?
מבחן Goodness-of-FIt מורכב משיטות בדיקה שונות. מטרת הבדיקה תעזור לקבוע באיזו שיטה להשתמש. לדוגמה, אם המטרה היא לבדוק תקינות על מדגם קטן יחסית, בדיקת שפירו-וילק עשויה להתאים. אם רוצים לקבוע אם מדגם הגיע מהתפלגות ספציפית בתוך אוכלוסייה, ייעשה שימוש במבחן קולמוגורוב-סמירנוב. כל בדיקה משתמשת בנוסחה הייחודית שלה. עם זאת, יש להם מאפיינים משותפים, כגון השערת אפס ורמת מובהקות.
השורה התחתונה
מבחני התאמה קובעים עד כמה נתוני המדגם תואמים את המצופה מאוכלוסיה. מנתוני המדגם נאסף ערך נצפה ומשווה לערך הצפוי המחושב באמצעות מדד אי התאמה. ישנן מבחני השערת כושר התאמה שונים זמינים בהתאם לתוצאה שאתה מחפש. בחירת מבחן ההתאמה הנכון תלויה במידה רבה במה שאתה רוצה לדעת על מדגם וכמה גדול המדגם. לדוגמה, אם רוצים לדעת אם הערכים שנצפו עבור נתונים קטגוריים תואמים את הערכים הצפויים עבור נתונים קטגוריים, השתמש בריבוע צ'י. אם רוצים לדעת אם מדגם קטן עוקב אחר התפלגות נורמלית, מבחן שפירו-וילק עשוי להיות יתרון. ישנן בדיקות רבות זמינות כדי לקבוע את מידת ההתאמה.