Afleveringen

  • Digital disparities among healthcare workers in typing speed between generations, genders, and medical specialties: cross sectional study

    במבחן אנובה הנחה מקדימה היא שההתפלגות של הערכים באוכלוסיית המחקר כולה היא נורמלית, וגם שהשונות בתוך קבוצה אחת דומה לשונות בתוך הקבוצות האחרות.

    המסקנה שאפשר להסיק כאשר התוצאה מובהקת, היא שלפחות אחת מהקבוצות שונה מהאחרות. כדי לדעת בין אלו קבוצות יש שוני, צריך להשתמש במבחן נוסף, שמותר להשתמש בו רק לאחר הוכחת מובהקות במבחן אנובה עצמו. דוגמה למבחן "אחרי" כזה הוא מבחן טוקי. במבחן זה מייצרים קנה מידה ובעזרתו מחליטים האם הבדל ממוצעים בין שתי קבוצות הוא מובהק.

    Post-hoc tests

    Tukey test

  • Digital disparities among healthcare workers in typing speed between generations, genders, and medical specialties: cross sectional study

    התוצאה של מבחן אנובה הוא ערך ה F. לערך זה יש התפלגות צפויה כאשר השערת האפס נכונה. כשיש ערך F שבלתי סביר לקבל כאשר השערת האפס נכונה, נדחה את השערת האפס. ניתן לכמת את הסבירות לקבל ערך F מסויים כאשר השערת האפס נכונה בעזרת טבלת F. בטבלה זו יש להתחשב גם בכמות הקבוצות (ככל שיש פחות קבוצות, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה), וגם בגודל הקבוצות (ככל שקטנות יותר, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה).

    F distibution

    F table

  • Zijn er afleveringen die ontbreken?

    Klik hier om de feed te vernieuwen.

  • Digital disparities among healthcare workers in typing speed between generations, genders, and medical specialties: cross sectional study

    ההברקה במבחן אנובה היא שמשתמשים בשתי דרכים שונות להעריך את השונות של אוכלוסיית המחקר. הראשונה הנקראת "מתוך" היא שימוש בקבוצות כאילו הן "מדגמים" מתוך כלל אוכלוסיית המחקר, ולכן אומדן של השונות הכללית לפי השונות בתוך הקבוצה עצמה.

    השנייה, הנקראת "מבין", היא שימוש בקשר בין שונות של ממוצעים לבין שונות של הערכים המקוריים (כאשר הערכים באוכלוסיה מתפלגים נורמלי)- קשר שאפשר לייצג אותו על ידי הכפלה במספר האנשים בקבוצה.

    שתי הדרכים האלו אמורות לאמוד את אותו המספר כאשר השערת האפס נכונה, ולכן אמורות להגיע למספר דומה, ואז חלוקה של שני המספרים האלו תתן לנו מספר הקרוב ל 1. אם הקבוצות מאוד שונות אחת מהשנייה, השונות בין הממוצעים תגדל, והדרך "מבין" תתן לנו הערכה הרבה יותר גדולה של השונות הכללית.

    היחס בין שתי הערכות השונות האלו- לפי הממוצעים ("מבין") חלקי לפי הקבוצות ("מתוך") הוא ערך ה-F, וזהו הסטטיסטי של מבחן אנובה. ככל שערך זה גדול יותר, כך ניטה יותר לדחות את השערת האפס.

    F statistic

  • Digital disparities among healthcare workers in typing speed between generations, genders, and medical specialties: cross sectional study

    במבחן הזה נשתמש כשיש יותר משתי קטגוריות למשתנה הבלתי תלוי, למשל כשיש יותר משתי קבוצות, וכאשר המשתנה התלוי (התוצא) הוא כמותי ומתפלג נורמלית. למשל, כשמשווים קצב הקלדה במחשב בין קבוצות גיל שונות של עובדי בית חולים, או בין התמחויות שונות.

    הסיבה שלא להשתמש במבחן הסטודנט עבור כל זוג וזוג של קטגוריות, היא שכך ייווצרו מבחנים מרובים עם השערות אפס מרובות, ולכן סיכוי גבוה לטעות מסוג אחד. במקום להשתמש בהבדל בין ממוצעים, כמו מבחן הסטודנט, מבחן אנובה משתמש בשונויות.

    One way ANOVA (analysis of variance)

  • Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake

    שונות במובנה העממי היא פיזור רחב של הערכים. אך במובן הפורמלי הסטטיסטי, שונות היא ערך מחושב (שאכן מציין מידת פיזור). במקרה של שונות עבור ממוצע בקבוצה אחת, השונות היא סכום הריבועים של מרחקי הערכים מהממוצע, חלקי (כמעט) מספר המדידות. שונות אינה ערך אינטואיטיבי, והיא לא בקנה המידה של הערכים הנמדדים. השורש של השונות הוא סטיית התקן, שנמצאת בקנה המידה של הערך הנמדד, ולכן קל להבין אותה אינטואיטיבית. בדומה לממוצע, אפשר לדבר על שונות הן במחקר (במדגם) והן באמת שמחוץ למחקר (באוכלוסיה).

    Variance- שונות במובן הפורמלי

    Variability- שונות במובן האיכותי/עממי

    Standard deviation

    Sum of squares

  • Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake

    מבחן טי למדגמים מזווגים הוא המקביל למבחן הסטודנט במצב בו ניתן לבצע זיווג בין מדידה בקטגוריה אחת של החשיפה למדידה בקטגוריה השנייה. זה קורה כאשר מדובר באותו משתתף שנמדד בשתי החשיפות (לפני-אחרי, עם התערבות אחת ואחר כך התערבות אחרת), או כאשר מתבצעת התאמה של אחד לאחד בין משתתפים בקבוצה אחת למשתתפים בקבוצה אחרת (לדוגמה- שכנים, אחים, התאמה לפי גורמי סיכון). היתרון של מבחן זה על מבחן הסטודנט הרגיל הוא שכאן השונות מחושבת לפי ההפרש במדידות המזווגות ולכן היא קטנה יותר. שונות קטנה יותר מגבירה את העוצמה של המחקר.

    במחקר על אורך ארוחת הערב כגורם לצריכת ירקות גבוהה יותר, אותם משתתפים נמדדו עבור שתי החשיפות האפשריות, ואכן בחשיפה לארוחה ארוכה יותר, כמות חתיכות הירק הממוצעת הייתה גדולה יותר באופן מובהק.

    Paired samples t-test

    Propensity score

    Before-after study

  • Endovascular thrombectomy plus medical care versus medical care alone for large ischaemic stroke: 1-year outcomes of the SELECT2 trial

    מבחן מאן-וויטני הוא המקביל למבחן הסטודנט עבור מצבים בהם המשתנה התלוי הוא אורדינלי או שהוא כמותי שלא מתפלג נורמלי. המבחן משתמש בדירוג משותף עבור שתי הקבוצות, ולאחר דירוג זה בודק האם סכום הדירוג בכל אחת מהקבוצות שונה בצורה דרמטית. השיטה היא נוסחה שבה מתוך סכום הדירוגים באחת הקבוצות ומגודל הקבוצה מתקבל המספר יו (U). עבור יו יש התפלגות דגימה נורמלית, ולכן אפשר לבצע בדיקת השערות: אם השערת האפס נכונה, מה הסבירות לקבל U כמו במחקר שלנו.

    במחקר על כריתת קריש הדם באירוע מוחי גדול, סולם המדידה של התוצא היה אורדינלי (סולם רנקין המשופץ). כאשר נבדק סכום הדירוגים בשתי הקבוצות, היה נראה שאכן בקבוצת הטיפול הסכום היה גבוה יותר בצורה מובהקת.

  • Endovascular thrombectomy plus medical care versus medical care alone for large ischaemic stroke: 1-year outcomes of the SELECT2 trial

    במבחנים פרמטרים, כמו מבחן הסטודנט, יש הנחות לגבי התפלגות המשתנה התלוי. אם אי אפשר לוודא שההנחות האלו נכונות, נצטרך להשתמש במבחן חלופי. פרמטר הוא מאפיין של האוכלוסיה או של "האמת" במקרה של מחקר רפואי. המבחנים הפרמטרים משתמשים במאפיינים של האמת הזו. למשל, מבחן הסטודנט משתמש בהשערת האפס לגבי הממוצע האמיתי. במבחן הא-פרמטרי המקביל, מבחן מאן-ויטני, אין השערה לגבי הממוצע האמיתי, ומשתשים אך ורק בדירוג ובמספר המשתתפים במחקר. דוגמאות למבחנים לא פרמטרים הן מבחן חי בריבוע, מאן ויטני וקרוסקל- וואליס.

    Non parametric tests

    Mann-Whitney U test

  • Efficacy and safety of the neonatal Fc receptor inhibitor efgartigimod in adults with primary immune thrombocytopenia (ADVANCE IV): a multicentre, randomised, placebo-controlled, phase 3 trial

    יש המון מבחנים סטטיסטים, עם הרבה שמות. אך לא צריך להיבהל מהכמות, רובם עושים את אותה העבודה. ננסה לעשות סדר. הבחירה במבחן מסוים היא לפי מספר מאפיינים של הנתונים שמעניינים אותנו. בעזרת בערך חמישה מאפיינים נוכל להבין באיזה מבחן רצוי להשתמש. חמישה מאפיינים כאלו הם: סוג המשתנה התלוי (ברפואה: התוצא), ההתפלגות שלו, מספר הקטגוריות של המשתנה הבלתי תלוי (ברפואה, פעמים רבות קבוצות הטיפול/ חשיפה), תלות בין מדידה בקבוצה אחת למדידה בקבוצה אחרת, והאם מבוצע תקנון עבור משתנים נוספים (ערפלנים).

    מבחן הסטודנט, למשל, הוא כאשר המשתנה התלוי הוא כמותי ומתפלג נורמלית, המשתנה הבלתי תלוי הוא עם שתי קטגוריות, ולא מתבצע תקנון. יש שני מבחנים דומים: כאשר יש תלות בין המדידות (paired t test) וכאשר אין תלות כזו (unpaired t test).

    הפניה לתרשים זרימה שיכול לעזור בבחירת המבחן הסטטיסטי המתאים

    statistical tests

    crème brûlée

    unpaired Student’s t test

    paired t-test

    ANOVA

    Mann-Whitney U test

    Linear multiple regression

    Spearman correlation

  • Endovascular thrombectomy plus medical care versus medical care alone for large ischaemic stroke: 1-year outcomes of the SELECT2 trial

    משתנים במחקר רפואי קליני הם לרוב מאפיינים של משתתף במחקר או תוצא שנמדד עבורו. למשל, במחקר על טיפול בכריתת קריש תוך מוחי לאחר אירוע מוחי גדול, יש שני משתנים שעניינו במיוחד את החוקרים: האם המטופל קיבל את הטיפול, ומהי רמת המוגבלות שלו לאחר שנה. במקרה הזה, יש משתנה אחד שרוצים לבדוק האם הוא תלוי באחר. האם רמת המוגבלות תלויה בטיפול. לכן, רמת המוגבלות היה המשתנה התלוי, והטיפול- המשתנה הבלתי תלוי.

    כדי להבין מהו סוג המשתנה כדאי לשאול מה התשובה המדווחת אצל משתתף בודד. אם מדובר בתשובה שהיא מלה ולא מספר, מדובר במשתנה נומינלי (קטגוריאלי). אם מדובר במספר, יש שתי אפשרויות- האחת שזהו משתנה אורדינלי והשנייה שזהו משתנה כמותי.

    משתנה אורדינלי לרוב נקבע לפי סולם כלשהו (למשל סולם רנקין המסווג אדם לאחר אירוע מוחי לפי דרגות הלקות: חסר תסמינים, לקות קלה, לקות קלה אך זקוק לעזרה, לקות בינונית, לקות בינונית-חמורה, ולקות חמורה). משתנה כמותי נקבע פעמים רבות לפי מדידה במכשיר (למשל, רמת הכולסטרול במכשיר מעבדה, לחץ הדם במד לחץ דם, זמן עד הגעה לטיפול רפואי בשעון). בין המשתנים הכמותיים ישנם משתנים בדידים- אלו משתנים שמקבלים רק ערכים שלמים (למשל, מספר אירועים בשנה) ומשתנים רציפים (שיכולים לקבל גם ערכים שאינם שלמים, למשל משקל.

    ניתן להפוך משתנה כמותי לאורדינלי ואורדינלי לנומינלי, אך לא להפך. עם הפיכה של משתנה עם יותר מידע (כמותי) למשתנה עם פחות מידע (קטגוריאלי) יש אבדן מידע והעוצמה של המחקר תרד.

    כאשר מציגים תוצאות או מדידות במחקר עבור משתתפים רבים, המשתנה הקטגוריאלי יוצג באחוזים, והמשתנה הכמותי/ אורדינלי יוצג כמדד מרכז ומדדי פיזור, למשל חציון וטווח בין רבעוני. לסיווג המשתנים יש חשיבות רבה ביותר בהבנה מתי ומדוע להשתמש במבחן סטטיסטי כלשהו.

    Categorical (nominal) variable

    Ordinal variable

    Quantitative variable

    Discrete /continuous quantitative variable

    Dependent variable

    Independent variable

  • Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis

    לאחר קבלת הסטטיסטי מהמבחן, במקרה שלנו ערך הטי (t), אנחנו רוצים לדעת מהו ערך הפי (p). הגאונות בהמצאת המבחן הסטטיסטי היא יצירת נוסחה שההתפלגות של התוצאה שלה צפויה מראש כאשר השערת האפס נכונה. אנחנו יודעים למשל על התפלגות טי שהיא התפלגות סימטרית, דומה מאוד לנורמלית כשהמדגם מספיק גדול. כאשר ההתפלגות צפויה מראש, אפשר להשתמש בטבלה של סבירויות לקבלת תוצאות שונות כשהשערת האפס נכונה. כך המבחן הסטטיסטי מתרגם נתונים גולמיים מהמחקר לסבירות מדוייקת לקבל נתונים אלו כאשר השערת האפס נכונה, במלים אחרות מייצר מתוך הנתונים את ערך הפי.

    Statistical test

    Student’s t test

    Statistic (eg. t statistic=t value)

    Sampling distribution- התפלגות הדגימה

    Null hypothesis- השערת האפס

    Standard error- שגיאת התקן

    t table

    p value

  • Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis

    מבחן הסטודנט הוא מבחן סטטיסטי להשוואה בין שני ממוצעים. במבחן זה, כמו בכל מבחן סטטיסטי, אנחנו מנסים להבין האם הממצאים במחקר מספיק דרמטיים כדי לשכנע אותנו שמדובר בתופעה אמיתית. במקרה של מבחן הסטודנט, הבדל אמיתי במציאות ולא סתם הבדל אקראי שהתגלה במחקר שלנו. גודל האפקט וכמות המשתתפים מגבירים את השכנוע שלנו, ולעומתם השונות, ככל שגדולה יותר, מקטינה את השכנוע שלנו. זה יתבטא בנוסחת מבחן הסטודנט, שבסופו של דבר נותן לנו תוצאה בצורת הסטטיטי "t". התוצאה הזו גדלה ככל שגודל האפקט (ההבדל בין הממוצעים) גדול יותר, וככל שכמות המשתתפים גדולה יותר, וקטנה כשסטיית התקן גדלה. דרך אחרת להסתכל על מבחן הסטודנט היא כמבחן שמשתמש בקנה המידה של סטיית התקן, כדי להחליט האם גודל האפקט במחקר הוא דרמטי מספיק כדי לדחות את השערת האפס.

    Student’s t test

    Statistic (eg. t statistic)

    p value

    standard deviation

    variance- שונות

    Effect size

    Sample size (n)

  • Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis

    איך מגיעים מנתוני תוצאות במחקר להחלטה האם לדחות את השערת האפס?

    מבחן סטטיסטי הוא מתכון (נוסחה) שלתוכו מוכנסים המצרכים (הנתונים מהמחקר שלנו) כך שתתקבל לבסוף עוגה ("הסטטיסטי"). הסטטיסטי עצמו נותן לנו את ערך הפי בעזרת טבלה. ככל שהסטטיסטי גדול יותר, ערך הפי נמוך יותר. אם העוגה תהיה תפוחה מספיק (הסטטיסטי גדול מספיק, לפי טבלה), ערך הפי יהיה קטן יותר ונוכל לדחות את השערת האפס.

    Statistical test

    Student’s t test

    Statistic (eg. t statistic)

    p value

    null hypothesis

  • Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT

    פרק בפודקאסט- תוצאות בדיקה אבחנתית- הדרך המדויקת יותר

    וידאו- הקדמה לסטטיסטיקה בייסיאנית

    כאשר יש דלקת קרום המח, ברוב המקרים יש גם חום. אך לא ניתן להפוך את הסדר ולקבל אותה סבירות. "כאשר יש חום, ברוב המקרים יש גם דלקת קרום המח". ערך הפי מעריך את הסבירות לממצא במחקר כאשר היפותזת האפס נכונה. גם כאן, כאשר הופכים את הסדר (“מה הסבירות שהיפותזת האפס נכונה כאשר נתונים לנו הממצאים במחקר”) נקבל מספר שונה מערך הפי. איך נחשב אותו?

    לפי השיטה הבייסיאנית, קיימת סבירות לנכונות של טענה עוד לפני קבלת ראיות. הראיות מגבירות או מפחיתות את הסבירות לנכונות הטענה. לכן, בחישוב הסבירות לנכונות טענה, צריך לקחת בחשבון גם את הסבירות שלפני. לדוגמה, במחקר קליני, קיימת סבירות לתועלת של התערבות עוד לפני ביצוע המחקר. סבירות זו נלקחת בחשבון ואז מתייחסים גם לעוצמת המחקר וגם למובהקות שלו כדי להגיע להערכה חדשה לגבי הסבירות שההתערבות עוזרת.

    בצורה פשטנית, חישוב הסבירות שהטיפול עוזר יהיה שבר (חלוקה). במונה: הסבירות שהטיפול עוזר וגם שיתקבלו ראיות לטובת הטיפול, ובמכנה: הסבירות שיתקבלו ראיות לטובת הטיפול (בין אם הטיפול עוזר או שלא עוזר).

    Bayesian statistics

    Prior

    Posterior

    Pre test probability

    Sensitivity

    Specificity

  • Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT

    הסבר בוידאו על מדדים של שונות קצב הלב (heart rate variability)

    שלוש טעויות נפוצות מאוד בפירוש ערך הפי הן קריאה תמימה המתעלמת מהטיות, כולל הטיות פרסום והטיות דיווח, בלבול בין משמעות סטטיסטית למשמעות קלינית (בעצם, בין מובהקות לבין חשיבות), ופירוש מתמטי שגוי של ערך הפי המתעלם מכך שמדובר בהסתברות מותנית.

    bias

    publication bias

    reporting bias

    statistical significance

    clinical significance

    conditional probability

  • Efficacy of the Epley maneuver for posterior canal BPPV: A long-term, controlled study of 81 patients

    Evolocumab and Clinical Outcomes in Patients with Cardiovascular Disease

    Automated Insulin Delivery in Women with Pregnancy Complicated by Type 1 Diabetes

    רוב הגורמים שיגרמו לנו להסיק מסקנות מוטעות ממחקר משותפים גם לטעות מסוג 1 וגם לטעות מסוג 2. הגורמים שיפחיתו סבירות לשתי הטעויות הם גודל המדגם (וגם מספר האירועים הצפוי), גודל האפקט, ודמיון בין המשתתפים בתוך הקבוצה (שונות נמוכה בתוך הקבוצה). מבין גורמים אלו, לחוקרים יש שליטה על גודל המדגם ובמידה מסוימת על השונות בין המשתתפים. ערך האלפא מיוחד בכך ששינוי שלו יקטין טעות אחת ויגדיל את הסבירות לטעות האחרת.

    type I and type II errors

    sample size

    effect size

    within group variation

    alpha value

  • Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine through 6 Months

    Azithromycin during Routine Well-Infant Visits to Prevent Death

    Efficacy of typhoid conjugate vaccine: final analysis of a 4-year, phase 3, randomised controlled trial in Malawian children

    עוצמה היא היכולת של מחקר לזהות אפקט או קשר שקיימים במציאות. העוצמה היא הסתברות מותנית, וקשורה רק למצב בו היפותזת החוקר נכונה. במידה והיפותזת החוקר נכונה, מה הסבירות שבבדיקת ההשערות נדחה את השערת האפס ונקבל את היפותזת החוקר. במובן הזה היא למעשה המשלימה של טעות מסוג שתיים. למשל, אם במידה והיפותזת החוקר נכונה, הסבירות לטעות מסוג שתיים היא 20%, אז עצמת המחקר היא 80%. בניגוד לערך ה-p, ובדומה לערך האלפא, העצמה מחושבת לפני קבלת תוצאות המחקר. העוצמה תלויה בין השאר בכמות המשתתפים במחקר, בכמות האירועים הצפויה, למשל כמות הילדים הצפויים להדבק בטייפואיד, ובגודל האפקט המשוער. גודל האפקט המשוער הוא ההבדל או היחס המשוער בין קבוצה אחת לשניה, למשל הפחתה של 75% במקרי הטייפואיד. אפשר להעריכו לפי מחקרים קודמים או להתייחס לאפקט המינימלי שיש לו משמעות קלינית.

    העוצמה גוברת כאשר המדגם גדול, אפקט הטיפול גדול, הפיזור של הערכים קטן (על הבט זה נדבר בפרק הבא), וערך אלפא גדול יותר.

    Power

    Type II error

    Estimated effect size

  • Randomised trial of genetic testing and targeted intervention to prevent the development and progression of Paget’s disease of bone

    כאשר היפותזת החוקר נכונה (היפותזת האפס אינה נכונה) מחקר לא תמיד יגיע למובהקות. תופעה זו נקראת טעות מסוג 2, והיא קורית מארבע סיבות עיקריות: מדגם קטן מדי, אפקט לא דרמטי, פיזור גדול בתוך הקבוצות של ערך שנבדק, וקביעת ערך אלפא נמוך.

    Type II error

  • Randomised trial of genetic testing and targeted intervention to prevent the development and progression of Paget’s disease of bone

    כאשר ערך הפי נמוך, ניתן לדחות את השערת האפס וכך לקבל ראיה לנכונות השערת החוקרים. אך מהו הסף לקביעת "נמוך" לעומת "לא נמוך"? ערך הסף הזה, כאשר נקבע מראש, נקרא "אלפא" ובמחקרים רבים נקבע שאלפא יהיה 0.05. כאשר ערך הפי נמוך מערך האלפא, והשערת האפס נדחית, ניתן לקבל את השערת החוקר והתוצאה מובהקת. כאשר ערך הפי גדול מערך האלפא, לא ניתן לדחות את השערת האפס והתוצאה אינה מובהקת. מה לגבי הבחירה השרירותית של אלפא כ 0.05? נדבר על הבעייתיות הנובעת מכך לגבי הוכחה בעזרת בדיקת השערות. אלפא קשורה באופן הדוק לטעות מסוג 1: מצב שבו השערת האפס נכונה אך הניתוח הסטטיסטי מראה מובהקות. למשל, שבעצם הטיפול לא עוזר בכלום, אך במחקר נמצאה תועלת מובהקת לעומת פלצבו.

    Alpha value

    Significance

    Type I error