עיניים על הטקסט

חוקרים בטכניון פיתחו טכנולוגיה המזהה, על סמך תנועות עיניים בלבד, היבטים שונים ביחסו של הקורא לטקסט שלפניו

חוקרים בפקולטה למדעי הנתונים וההחלטות מציגים השבוע בכנס בין-לאומי יוקרתי, מחקר חדשני העוסק בפענוח היבטים ספציפיים של יחסי קורא-טקסט. את העבודה הוביל הדוקטורנט עומר שובי יחד עם כפיר הדר, סטודנט לתואר שני, בהנחיית ד”ר יבגני ברזק, והיא מוצגת ב-ACL, אחד הכנסים היוקרתיים בעולם בתחום של עיבוד שפה טבעית (Natural Language Processing), המתקיים השבוע בווינה.

לקוראים שונים, כך מסבירים החוקרים, יש מטרות שונות כשהם קוראים טקסט נתון. בין אם זהו רומן, מתכון בישול, כתבה בעיתון או מאמר מדעי – כל טקסט יכול להיקרא מתוך כמה מטרות שונות. שתיים מהמטרות הן הבנה (קריאה רגילה) וחיפוש מידע. צוות המחקר פיתח מודלים חישוביים שמשלבים ניטור תנועות העיניים (Eye-tracking) ועיבוד טקסט. מודלים אלה מצליחים לזהות את מטרת הקריאה בדיוק של כ90%. מהירות הזיהוי גם היא מרשימה – כשתי שניות מתחילת הקריאה.

לדברי ד”ר ברזק, “העבודה היא חלק מתוכנית מחקר רחבה יותר שבה אנו מפתחים מודלים של בינה מלאכותית שיאפשרו לנו להסיק, בזמן אמת ועל סמך תנועות עיניים בלבד, מהו הידע הלשוני של הקורא, מהי האינטראקציה שלו עם הטקסט, מה ההבדל בין קריאה ראשונה של טקסט לקריאה חוזרת, מה מידת הקריאוּת (readability) של טקסט נתון, ואפילו מהו המידע הספציפי שהקורא מחפש. מחקרים אלה סוללים דרכים חדשות להערכה של ידע לשוני, התאמה אישית של טקסטים על פי רמת הקריאה של הקורא, להנגשה נרחבת של מידע טקסטואלי לאוכלוסיות שונות, ועוד.”

מערכות לניטור תנועות עיניים נהיות נגישות, זולות ומדויקות, וכמה מהטכנולוגיות מאפשרות לבצע ניטור זה באמצעות מכשירים נפוצים כגון אייפד וטלפון. החוקרים מקווים שטכנולוגיות אלה יאיצו את השימוש במודלים שהם פיתחו, זאת לטובת המשתמשים וספקי התוכן בעולמות כגון מוסדות חינוך, גופים ממשלתיים, ערוצי תקשורת ועוד.

ד”ר יבגני ברזק, חבר סגל בפקולטה למדעי הנתונים וההחלטות וראש המעבדה לשפה, חישוביות וקוגניציה, הצטרף לפקולטה בשנת 2021 לאחר דוקטורט ופוסט-דוקטורט ב-MIT.