הסטטיסטיקה לא משקרת

לרגל יום הסטטיסטיקה העולמי, המתקיים ב-20 באוקטובר ביוזמת האו”ם, בחרנו להציג בפניכם את המעבדה לסטטיסטיקה בפקולטה להנדסת תעשייה וניהול בטכניון, בראשות פרופ’-חבר אילה כהן. מטרת היום המיוחד: להגביר את האמון בכלים סטטיסטיים ולהצביע על חשיבותם כאמצעי לקבלת החלטות שקולות ומבוססות מידע, המועילות לחברה ולאנושות בכל תחומי החיים.

“שלושה סוגי שקרים יש בעולם: שקרים, שקרים איומים וסטטיסטיקה”, קובעת האימרה המיוחסת (כנראה בטעות) לראש ממשלת בריטניה במאה ה 19, בנימין ד’יזראלי. ואכן, סביב תחום הסטטיסטיקה צמחו אינספור מיתוסים, אמירות שגויות ובדיחות. רבים סבורים כי הניתוח הסטטיסטי מוביל לעתים קרובות למסקנות מוטעות מכיוון שאי אפשר להסיק ממנו קביעות חד משמעיות.

תפיסה שגויה זו נובעת לא מחולשתה של הסטטיסטיקה אלא משימוש שגוי בכלים הסטטיסטיים. דוגמה לשימוש מסוג זה היא הגרף שהציג לאחרונה חבר הקונגרס הרפובליקאי ג’ייסון צִ’ייפֵץ (Chaffetz) במסגרת דיון בנושא הפלות בארה”ב. חבר הקונגרס הביע מורת רוח על “ההשקעה המופרזת” בתכנון המשפחה על חשבון יעדים אחרים דוגמת המאבק בסרטן. בגרף שהציג מסומנת ההשקעה בהפלות בקו אדום, ואילו ההשקעה במניעת סרטן מסומנת בוורוד.

גרף

אבל הגרף שלעיל מטעה: העדרו של ציר אנכי (Y), כלומר של אמת מידה אחידה לשני המדדים, שימש את חבר הקונגרס ליצירת תמונה מעוותת המנפחת את שיעור העליה בהשקעה בהפלות.

אילו הוצגו הנתונים באופן הוגן היה הגרף נראה כך:

גרף

בגרף הנכון מסומן בציר האנכי שיעור ההשקעה הכספית, וכך מקבלות ההשקעות בשני התחומים אמת מידה משותפת. מצג זה מבהיר כי בשעה שההשקעה בתכניות למניעת סרטן אכן ירדה משמעותית, העלייה בהשקעה בהפלות זניחה ביחס אליה.

סטטיסטיקה היא כלי המשמש אותנו היטב כשאנו משתמשים בו נכון. תחזיות מזג האוויר מבוססות על מודלים סטטיסטיים; רישיונות לתרופות מבוססים על ניתוחים סטטיסטיים של הניסויים הקליניים; וקריטריונים לקבלת מועמדים לעבודה וללימודים גבוהים מבוססים על ניבוי הצלחה באמצעות עיבודים סטטיסטיים.

התפתחות המחשבים החדישים האיצה את פיתוחן של שיטות סטטיסטיות חדשניות, המשלימות או מחליפות את השיטות הקלאסיות של עיבוד הנתונים. היקפי האחסון שאפיינו את ראשית עידן המחשוב לא אפשרו תיעוד נרחב ולא חישובים מורכבים. לכן התבססו השיטות הקלאסיות על מודלים הסתברותיים מקורבים בלבד. כיום, לעומת זאת, מושתת העיבוד הסטטיסטי על נפח נתונים גדול, ושיטות ההסקה אינן מצריכות בהכרח הנחות מקורבות. התפתחות זו מיושמת בהצלחה רבה בתחום של כריית נתונים ( data mining) – הפקת מידע מתוך אוסף נתונים גדול ורב-משתנים.

במעבדה לסטטיסטיקה בפקולטה להנדסת תעשייה וניהול בטכניון, בראשות פרופ’-חבר אילה כהן, נערכים מחקרים סטטיסטיים רבים בשיתוף עם חוקרים ממוסדות אקדמיים בארץ ובחו”ל במקרים בהם נדרשים ניתוחים סטטיסטיים בשיטות מתקדמות וחדשניות. כמו כן מסייעת המעבדה לסטודנטים לתארים מתקדמים בטכניון ומחוצה לו וכן לחברות פרטיות, משרדי ממשלה, בתי חולים ועוד. פרופ’ כהן מציגה כמה דוגמאות למחקרים שנעשו במעבדה בשנים האחרונות:

מוסר תשלומים. “המחקר, שנערך עבור חברה למתן משכנתאות, נועד לגלות את מאפייניהם של ‘הלוֹוִים הטובים’, העומדים בהחזר החודשי, לעומת אלה המפגרים בתשלומים. בסיום המחקר הוגדר הפרופיל הטיפוסי לכל אחד משני סוגי הלווים.”

אומדן נפגעים. “תיעוד מקרי הפגיעות הקשות בתאונות דרכים הוא אתגר מורכב, שכן מקרים רבים אינם מתועדים על ידי המשטרה ומרכזי הטראומה. לפיכך פותחה במחקר הנדון שיטה חדשה לאומדן המקרים על ידי “ניפוח” מחושב של הדיווחים. השיטה מתבססת על פיתוחים שנעשו לאחרונה בתחום הסטטיסטיקה בהקשרים ביולוגיים של אומדן גודל אוכלוסייה (שיטת Capture-Recapture ). המחקר נערך בשיתוף ד”ר ויקטוריה גיטלמן מהמכון לחקר התחבורה בטכניון, ומומן על ידי קרן המחקרים בענייני ביטוח ליד איגוד חברות הביטוח בישראל.”

יעילות טיפול רפואי. “במחקר, שבחן השפעה של תרופות על ילדים חולי קרוהן (מחלת מעי דלקתית), נבחנה יעילותן היחסית של תרופות הנצרכות דרך הפה לעומת תרופות הניתנות בזריקה. לעתים קרובות קשה לאמוד את היעילות התרופתית של כל אחת מהשיטות מכיוון שאופן הטיפול בחולה משתנה על פי מצבו ואינו נתון להחלטת החוקר. לפיכך נעשה במחקר זה שימוש בשיטה הקרויה Propensity Analysis . בשיטה זו נלקחת בחשבון גם ההסתברות-לטיפול, כלומר הסיכוי שהמטופל יקבל טיפול מסוים (גם אם לא קיבל אותו בפועל). העיבודים הסטטיסטיים במחקר זה נעשו במסגרת מחקרו של פרופסור דן טרנר מבית החולים שערי צדק ובסיועם של רופאים רבים ממרכזים שונים בעולם. ממצאי המחקר פורסמו בכתב העת הרפואיGUT .”

לשתות כדי לשרוד. “מחקר זה בחן את הסיבות לשימוש באלכוהול כאמצעי להתמודדות עם לחץ נפשי. במחקר נותחו נתונים הנוגעים לצוותי הכיבוי ביחידות שונות של מכבי האש במדינת ניו יורק. המסקנה: השקעת משאבי היחידה בצורה נכונה יכולה להפחית את הלחץ על העובד, וכך למנוע ממנו דיכאון המוביל לשתייה. המחקר נערך על ידי פרופסור פטר במברגר מאוניברסיטת תל אביב ופרופסור סם בכרך מאוניברסיטת קורנל, וממצאיו פורסמו בכתב העת Journal of Applied Psychology.”

ניבוי הצלחה בלימודים. “מבחני מיון ללימודים או לעבודה נועדו לאתר את המועמדים הצפויים להצליח בלימודים או בעבודה. מאחר שיעילות המיון (כלומר ההצלחה-בפועל) נמדדת רק בקרב אלה שעברו את מבחן המיון, קשה לאמוד את המִתאם בין הניבוי להצלחה-בפועל. במחקר, שהתבסס על ציוני הקבלה (פסיכומטרי ובגרות) של סטודנטים בטכניון ועל ציוניהם בשנה הראשונה, פותחו שיטות ניתוח חדשניות כדי להתגבר על הקושי האמור. מחקר זה נערך בשיתוף עם ד”ר תמר קנת-כהן מהמרכז הארצי לבחינות ולהערכה ובמימון הקרן השייכת למרכז.”

המעבדה לסטטיסטיקה בטכניון נוסדה לפני 30  שנה על ידי פרופ’ פאול פייגין (כיום סגן נשיא הטכניון לפרויקטים אסטרטגיים) ופרופ’-חבר אילה כהן. המעבדה, הפועלת במסגרת מוסד הטכניון למחקר ופיתוח, היא אחת ממעבדות הפקולטה להנדסת תעשייה וניהול. צוות המעבדה הקבוע כולל כיום, מלבד ראש המעבדה פרופ’ כהן, את הסטטיסטיקאיות ד”ר אטי דובא וד”ר טטיאנה אומנסקי.פרופ'-חבר אילה כהן