מהו מבחן T?
מהו מבחן T? מבחן t הוא סטטיסטיקה מסקנת המשמשת כדי לקבוע אם יש הבדל משמעותי בין האמצעים של שתי קבוצות וכיצד הם קשורים. מבחני T משמשים כאשר מערכי הנתונים עוקבים אחר התפלגות נורמלית ויש להם שונות לא ידועות, כמו מערך הנתונים שנרשם מהטלת מטבע 100 פעמים. מבחן ה-t הוא מבחן המשמש לבדיקת השערות בסטטיסטיקה ומשתמש ב-t-statistic, thet-distributionvalues ו דרגות החופש כדי לקבוע מובהקות סטטיסטית.
מהו מבחן T? – מבחן ה-t הוא מבחן המשמש לבדיקת השערות בסטטיסטיקה ומשתמש ב-t-statistic, thet-distributionvalues ו דרגות החופש כדי לקבוע מובהקות סטטיסטית.
מהו מבחן T? – נקודות מרכזיות
הבנת T-Test
מבחן t משווה את הערכים הממוצעים של שני מערכי נתונים וקובע אם הם הגיעו מאותה אוכלוסייה. בדוגמאות שלעיל, למדגם של תלמידים מכיתה א' ולמדגם של תלמידים מכיתה ב' לא יהיו כנראה אותו ממוצע וסטיית תקן. באופן דומה, דגימות שנלקחו מקבוצת הביקורת שניתנה מפלסבו ואלו שנלקחו מקבוצת התרופות שנקבעו צריכות להיות בעלות ממוצע וסטיית תקן שונה במקצת.
מבחינה מתמטית, מבחן ה-t לוקח דוגמה מכל אחת משתי הקבוצות וקובע את הצהרת הבעיה. היא מניחה השערת אפס ששני האמצעים שווים.
באמצעות הנוסחאות מחושבים ערכים ומשווים מול הערכים הסטנדרטיים. השערת האפס המשוערת מתקבלת או נדחית בהתאם. אם השערת האפס מתאימה להידחות, היא מעידה על כך שקריאות הנתונים הן חזקות וכנראה אינן נובעות מקריות.
מבחן ה-t הוא רק אחד מבדיקות רבות המשמשות למטרה זו. סטטיסטיקאים משתמשים במבחנים נוספים מלבד מבחן t כדי לבחון יותר משתנים וגדלים גדולים יותר של מדגם. עבור גודל מדגם גדול, סטטיסטיקאים משתמשים ב-az-test. אפשרויות בדיקה אחרות כוללות את מבחן הצ'י ריבוע ואת מבחן ה-f.
שימוש במבחן T
קחו בחשבון שיצרן תרופות בודק תרופה חדשה. לאחר ההליך המקובל, התרופה ניתנת לקבוצה אחת של חולים ופלסבו לקבוצה אחרת הנקראת קבוצת הביקורת. הפלצבו הוא חומר ללא ערך טיפולי ומשמש מדד למדידת האופן שבו הקבוצה השנייה, שניתנה את התרופה בפועל, מגיבה.
לאחר הניסוי בתרופה, חברי קבוצת הביקורת שניזונו בפלסבו דיווחו על עלייה בתוחלת החיים הממוצעת של שלוש שנים, בעוד שחברי הקבוצה שנרשמו לתרופה החדשה דיווחו על עלייה בתוחלת החיים הממוצעת של ארבע שנים.
תצפית ראשונית מצביעה על כך שהתרופה פועלת. עם זאת, ייתכן גם שההתבוננות עשויה להיות בגלל מקרה. ניתן להשתמש במבחן t כדי לקבוע אם התוצאות נכונות וישימות לכלל האוכלוסייה.
ארבע הנחות נעשות תוך שימוש במבחן t. הנתונים שנאספים חייבים לעקוב אחר סולם רציף או אורדינל, כגון ציוני מבחן מנת משכל, הנתונים נאספים מחלק שנבחר באקראי מכלל האוכלוסייה, הנתונים יגרמו להתפלגות נורמלית של עקומה בצורת פעמון, וכן שונות שווה או הומוגנית קיימת כאשר הווריאציות הסטנדרטיות שוות.
T-Score
דרגות חופש מתייחסות לערכים במחקר שיש לו את החופש להשתנות וחיוניים להערכת החשיבות והתקפות של השערת האפס. חישוב ערכים אלה תלוי בדרך כלל במספר רשומות הנתונים הזמינות בערכת המדגם.
מבחן T-מדגם מזווג
מבחן t בקורלציה, או מבחן t מצמד, הוא סוג תלוי של בדיקה ומתבצע כאשר הדגימות מורכבות מזוגות תואמים של יחידות דומות, או כאשר ישנם מקרים של מדידות חוזרות. לדוגמה, ייתכנו מקרים שבהם אותם מטופלים נבדקים שוב ושוב לפני ואחרי קבלת טיפול מסוים. כל מטופל משמש כמדגם בקרה נגד עצמו.
שיטה זו חלה גם על מקרים שבהם הדגימות קשורות או בעלות מאפיינים תואמים, כמו ניתוח השוואתי הכולל ילדים, הורים או אחים.
הנוסחה לחישוב ערך t ודרגות החופש עבור מבחן t זוגי היא:
T=mean1−mean2s(diff)(n)where:mean1andmean2=הערכים הממוצעים של כל מדגם sets(diff)=סטיית התקן של הפרשים של הנתונים הצמדים valuesn=ה מספר המדגם של המדגם (אם המדגם n−1=דרגות החופש\begin{aligned}&T=\frac{\textit{mean}1 – \textit{mean}2}{\frac{s(\text{diff})}{\sqrt{( n)}}}\\&\textbf{כאשר:}\\&\textit{mean}1\text{ ו-}\textit{mean}2=\text{הערכים הממוצעים של כל אחת מקבוצות הדוגמא}\\ &s(\text{diff})=\text{סטיית התקן של ההבדלים בין ערכי הנתונים המזווגים}\\&n=\text{גודל המדגם (מספר ההבדלים המזווגים)}\\&n-1=\text {The degrees of freedom}\end{aligned}T=(n)s(diff)mean1−mean2where:mean1andmean2=הערכים הממוצעים של כל מדגם setss(diff)=סטיית התקן של ההפרשים של הנתונים המוצמדים valuesn=גודל המדגם (מספר ההבדלים הצמדים) n−1= דרגות החופש
שוני שווה או מבחן T מאוחד
מבחן t השונות שווה הוא מבחן t עצמאי ומשמש כאשר מספר הדגימות בכל קבוצה זהה, או השונות של שני מערכי הנתונים דומה.
הנוסחה המשמשת לחישוב ערך t ודרגות חופש עבור מבחן t השונות השווה היא:
T-value=mean1−mean2(n1−1)×var12+(n2−1)×var22n1+n2−2×1n1+1n2where:mean1andmean2=ערכים ממוצעים של כל מדגם setsvar1andvar2=שונות של כל מדגם ו-2 של Numbern= רשומות ב כל מדגם סט\begin{aligned}&\text{T-value} = \frac{ mean1 – mean2 }{\frac {(n1 – 1) \times var1^2 + (n2 – 1) \times var2^ 2 }{ n1 +n2 – 2}\times \sqrt{ \frac{1}{n1} + \frac{1}{n2}} } \\&\textbf{כאשר:}\\&mean1 \text{ ו-} mean2 = \text{ערכים ממוצעים של כל אחד} \\&\text{של קבוצות המדגם}\\&var1 \text{ ו-} var2 = \text{שונות של כל אחת מקבוצות הדוגמא}\\&n1 \text{ ו-} n2 = \text{מספר רשומות בכל סט מדגם} \end{aligned}T-value=n1+n2−2(n1−1)×var12+(n2−1)×var22×n11+n21 mean1−mean2where:mean1andmean2=ערכים ממוצעים של כל מדגם setsvar1andvar2=שונות של כל מ מדגם setsn1andn2=מספר רשומות ב כל סט מדגם
ו,
דרגות חופש=n1+n2−2where:n1andn2=מספר רשומות ב כל קבוצת דוגמה\begin{aligned} &\text{דרגות חופש} = n1 + n2 – 2 \\ &\textbf{כאשר:}\\ &n1 \text{ ו-} n2 = \text{מספר רשומות בכל סט מדגם} \\ \end{aligned}דרגות חופש=n1+n2−2כאשר:n1andn2=מספר רשומות ב כל סט מדגם
T-Test של שונות לא שווה
אי-השונות t-testes הוא מבחן t עצמאי ומשמש כאשר מספר הדגימות בכל קבוצה שונה, וגם השונות של שני מערכי הנתונים שונה. מבחן זה נקרא גם מבחן ה-t של Welch.
הנוסחה המשמשת לחישוב ערך t ודרגות חופש עבור מבחן t שונות לא שווה היא:
T-value=mean1−mean2(var1n1+var2n2)where:mean1andmean2=ערכים ממוצעים של כל אחד של הדגימה setsvar1andvar2=שונות של כל מ מדגם setsn1andn2=מספר הרשומות בהתאם בקבוצה{\ value}=\frac{mean1-mean2}{\sqrt{\bigg(\frac{var1}{n1}{+\frac{var2}{n2}\bigg)}}}\\&\textbf{where:} \\&mean1 \text{ ו-} mean2 = \text{ערכים ממוצעים של כל אחד} \\&\text{של קבוצות הדוגמא} \\&var1 \text{ ו-} var2 = \text{שונות של כל אחת מקבוצות הדוגמא} \\&n1 \text{ ו-} n2 = \text{מספר רשומות בכל סט מדגם} \end{aligned}T-value=(n1var1+n2var2)mean1−mean2where:mean1andmean2=ערכים ממוצעים של eachof the sample setsvar1andvar2=שונות של כל מה מדגם setsn1andn2=מספר רשומות בכל סט מדגם
ו,
דרגות חופש=(var12n1+var22n2)2(var12n1)2n1−1+(var22n2)2n2−1where:var1andvar2=שונות של כל מ מדגם setsn1andn2=מספר של רשומות{sample aligned in each} &\text דרגות חופש} = \frac{ \left ( \frac{ var1^2 }{ n1 } + \frac{ var2^2 }{ n2 } \right )^2 }{ \frac{ \left ( \frac{ var1^ 2 }{ n1 } \right )^2 }{ n1 – 1 } + \frac{ \left ( \frac{ var2^2 }{ n2 } \right )^2 }{ n2 – 1}} \\ &\textbf {היכן:}\\ &var1 \text{ ו-} var2 = \text{שונות של כל אחת מקבוצות הדוגמא} \\ &n1 \text{ ו-} n2 = \text{מספר רשומות בכל קבוצת דוגמא} \\ \end {aligned}דרגות של חופש=n1−1(n1var12)2+n2−1(n2var22)2(n1var12+n2var22)2כאשר:var1andvar2=שונות של כל מה מדגם מקבוצות n1andn2=מספר רשומות בכל סט מדגם
באיזה מבחן T להשתמש?
ניתן להשתמש בתרשים הזרימה הבא כדי לקבוע באיזה מבחן t להשתמש בהתבסס על המאפיינים של ערכות הדוגמאות. הפריטים העיקריים שיש לקחת בחשבון כוללים את הדמיון של רשומות המדגם, מספר רשומות הנתונים בכל סט מדגם, והשונות של כל סט מדגם.
דוגמה ל-T-Test של שונות לא שווה
נניח שנלקחת המדידה האלכסונית של ציורים שהתקבלו בגלריה לאמנות. קבוצת דוגמאות אחת כוללת 10 ציורים, ואילו השנייה כוללת 20 ציורים. מערכי הנתונים, עם ערכי הממוצע והשונות המתאימים, הם כדלקמן:
סט 1 סט 219.728.320.426.719.620.117.823.318.525.218.922.118.317.718.927.619.520.621.9513.723.216.217.82.23.243.216.118.317.718.921. 13.3ממוצע19.421.6שונות1.417.1
למרות שהממוצע של סט 2 גבוה מזה של סט 1, איננו יכולים להסיק שלאוכלוסיה המקבילה לקבוצה 2 יש ממוצע גבוה יותר מהאוכלוסייה המקבילה לקבוצה 1.
האם ההבדל בין 19.4 ל-21.6 נובע ממקרי בלבד, או שקיימים הבדלים באוכלוסיות הכוללות של כל הציורים שהתקבלו בגלריה לאמנות? אנו מבססים את הבעיה על ידי הנחת השערת האפס שהממוצע זהה בין שתי קבוצות המדגם ועורכים מבחן t כדי לבדוק אם ההשערה סבירה.
מכיוון שמספר רשומות הנתונים שונה (n1 = 10 ו-n2 = 20) וגם השונות שונה, ערך ה-t ודרגות החופש מחושבים עבור מערך הנתונים שלעיל באמצעות הנוסחה המוזכרת בסעיף T-Test של שונות לא שווה.
ערך t הוא -2.24787. מכיוון שניתן להתעלם מסימן המינוס בעת השוואת שני ערכי t, הערך המחושב הוא 2.24787.
ערך דרגות החופש הוא 24.38 ומצטמצם ל-24, עקב הגדרת הנוסחה המחייבת עיגול כלפי מטה של הערך לערך השלם המינימלי האפשרי.
אפשר לציין רמת הסתברות (רמת אלפא, רמת מובהקות,p) כקריטריון לקבלה. ברוב המקרים, ניתן להניח ערך של 5%.
באמצעות ערך מידת החופש כ-24 ורמת מובהקות של 5%, מבט בטבלת התפלגות t-value נותן ערך של 2.064. השוואת ערך זה מול הערך המחושב של 2.247 מצביעה על כך שערך ה-t המחושב גדול מערך הטבלה ברמת מובהקות של 5%. לכן, בטוח לדחות את השערת האפס שאין הבדל בין אמצעים. למערך האוכלוסייה יש הבדלים מהותיים, והם לא במקרה.
כיצד משתמשים בטבלת הפצת T?
טבלת הפצת T זמינה בפורמטים של זנב אחד ושני זנבות. הראשון משמש להערכת מקרים בעלי ערך קבוע או טווח עם כיוון ברור, חיובי או שלילי. לדוגמה, מה ההסתברות שערך הפלט יישאר מתחת ל-3, או יקבל יותר משבע בעת הטלת זוג קוביות? האחרון משמש לניתוח מוגבל לטווח, כגון שאלה אם הקואורדינטות נופלות בין -2 ל-+2.
מהו מבחן T עצמאי?
הדגימות של מבחני t עצמאיים נבחרים ללא תלות זה בזה, כאשר מערכי הנתונים בשתי הקבוצות אינם מתייחסים לאותם ערכים. הם עשויים לכלול קבוצה של 100 חולים שאינם קשורים באופן אקראי, מחולקת לשתי קבוצות של 50 חולים כל אחת. אחת הקבוצות הופכת לקבוצת הביקורת ומקבלת פלצבו, בעוד שהקבוצה השנייה מקבלת טיפול שנקבע. זה מהווה שתי קבוצות מדגם עצמאיות שאינן מזווגות ואינן קשורות זו לזו.
מה מסביר מבחן T וכיצד משתמשים בהם?
מבחן t הוא מבחן סטטיסטי המשמש להשוואת האמצעים של שתי קבוצות. הוא משמש לעתים קרובות בבדיקת השערות כדי לקבוע אם לתהליך או לטיפול יש השפעה על אוכלוסיית העניין, או ששתי קבוצות שונות זו מזו.