ניבוי קולע

חוקרים בטכניון פיתחו שיטה חדשה לניבוי ביצועיהם של כדורסלנים. השיטה מבוססת על ניתוח ביצועי העבר של השחקן ושל דברים שאמר בראיונות לפני המשחק

שיטה חישובית שפותחה בטכניון משפרת משמעותית את ניבוי ביצועיהם של שחקני כדורסל. את המחקר הובילו הדוקטורנטים אמיר פדר ונדב עובד בהנחייתו של פרופ' רועי רייכרט מהפקולטה להנדסת תעשייה וניהול ע"ש דוידסון.

ניבוי ביצועיהם של שחקנים, המעסיק ספורטאים ומאמנים בכל ענפי הספורט, מהווה אתגר מחקרי עבור חוקרים רבים ברחבי העולם. היעד היישומי של המחקרים בתחום הוא לנבא את התנהגותם של השחקנים ואת ביצועיהם במשחק – מספר קליעות, מספר נקודות, איבוד כדורים וכו'. הכלים המחקריים הנחוצים לשם כך מגיעים מעולמות הפסיכולוגיה, הסטטיסטיקה, מדעי המחשב ועוד.

מרבית המחקרים שעסקו בכך עד כה הסתמכו, לצורך ניבוי ביצועי השחקן, על ביצועי העבר שלו. שיטה זו הניבה הצלחות מוגבלות בניבוי, וזה הרקע לקונספט החדשני שמפרסמים חוקרי הטכניון במאמר בכתב העת Computational linguistics. החוקרים הוסיפו לתמונה, כלומר לנתוני המוצא לניבוי, מידע "חוץ-משחקי", ובאופן ספציפי יותר  – תמלילים של ראיונות הנערכים עם השחקנים לפני המשחק. זאת מתוך הנחה שראיונות בטרם משחק מכילים מידע חשוב העשוי לשפר את איכות הניבוי של התנהגות השחקנים ושל ביצועיהם במשחק הקרוב.

החוקרים מדגישים כי התנהגותו של שחקן ספציפי במשחק קשה מאוד לניבוי, שכן מדובר בפעילות שאינה מתרחשת במעבדה אלא במרחב מורכב ודינמי. פעילות זו מושפעת מהסביבה כמו גם מהחלטות רציונלית ורגשות פנימיים, ואם לא די בכך – היא גם משפיעה על אותם רגשות. כל הדינמיקה הזאת אינה משוקללת בניבויים המקובלים, המבוססים על ביצועי עבר.

כדי להעמיד את המחקר על בסיס רחב כללו החוקרים במחקר 5,226 צמדים של ראיון-ביצועים של שחקני NBA בולטים (36 שחקנים), וחיפשו בכל אחד מהצמדים את הקשר בין הריאיון לביצועים. הקשר האמור נמדד באמצעות הקורלציה בין תמליל הריאיון לבין סטיות במדדי הביצוע במשחק – מאפייני סיכון, התנהגות והחלטות אסטרטגיות. דוגמה לסיכון היא ניסיון לקלוע לסל מרחוק (טווח שלוש הנקודות). דוגמה להתנהגות ולאסטרטגיה – בחירת דפוס הגנה מסוים.

בפיתוח המודלים לניבוי השתמשו החוקרים ברשתות נוירונים עמוקות – פלטפורמות המאתרות קשרים וקורלציות על סמך כמות עצומה של דוגמאות. לדברי פרופ' רייכרט, "במאמר אנחנו מראים שאפילו ניבוי על סמך תמליל הריאיון בלבד הוא טוב ומדויק מניבויים המסתמכים על ביצועי עבר. למרות זאת לא הסתפקנו בשיפור זה ואיחדנו את שני מקורות המידע – הריאיון וביצועי העבר – וכך יצרנו שילוב מנצח המוביל לדיוק גבוה יותר בניבוי ביצועי השחקן."

לדוגמה, בראיון לפני משחק בסדרת הגמר של 2016 נשאל לברון ג׳יימס, שחקן קליבלנד קאבלירס, לגבי המצב המנטלי שבו הוא נכנס לסדרת הגמר והקשר בין מצבו הנוכחי להיסטוריה האישית שלו (ג׳יימס נולד בקליבלנד וחזר לקבוצה כדי להביא לה אליפות ראשונה בהיסטוריה). בתשובתו מתאר ג׳יימס את מצבו המנטלי ואת הריכוז והנינוחות שלו לקראת המשחקים הבאים. בהתאם לכך, מסביר פרופ' רייכרט, "המודלים שלנו עיבדו את הטקסט וניחשו שביצועיו ההתקפיים של ג׳יימס יהיו טובים יותר מממוצעי העבר שלו. בפועל, סדרת הגמר של 2016 הסתיימה בזכייתה הראשונה – והיחידה – של קליבלנד באליפות. במשחקים אלו ג׳יימס אכן התעלה על עצמו וכיכב לאורך הסדרה, כפי שהמודלים שלנו ניבאו."

 

בתרשים: איכות בניבוי ביצועיהם של שחקני NBA. העמודות משמאל לימין: Dataset majoriy baseline – ניבוי בשיטה נאיבית; Metric-only baseline – ניבוי על סמך ביצועי עבר; ניבוי על סמך ראיונות (השיטה שפיתחו חוקרי הטכניון); וניבוי על בסיס משולב (ראיונות וביצועי עבר).  

בתרשים: איכות בניבוי ביצועיהם של שחקני NBA. העמודות משמאל לימין: Dataset majoriy baseline – ניבוי בשיטה נאיבית; Metric-only baseline – ניבוי על סמך ביצועי עבר; ניבוי על סמך ראיונות (השיטה שפיתחו חוקרי הטכניון); וניבוי על בסיס משולב (ראיונות וביצועי עבר).

 

 

עבור כל שחקן מתאר התרשים את הביצועים של המודל בחיזוי כל אחת מ-7 המשימות. הקו השחור מתאר את ממוצע המודל, לכן אם עבור שחקן יש נקודה כתומה (לדוגמה) מימין לקו, פירוש הדבר הוא שהמודל טוב יותר בחיזוי הנקודות של אותו שחקן בהשוואה לשחקנים אחרים.

עבור כל שחקן מתאר התרשים את הביצועים של המודל בחיזוי כל אחת מ-7 המשימות. הקו השחור מתאר את ממוצע המודל, לכן אם עבור שחקן יש נקודה כתומה (לדוגמה) מימין לקו, פירוש הדבר הוא שהמודל טוב יותר בחיזוי הנקודות של אותו שחקן בהשוואה לשחקנים אחרים.