כך מתמודד המוח עם יחידות-טקסט גדולות

חוקרים בטכניון גילו כי בניגוד למודלי שפה מלאכותיים, המנתחים טקסטים ארוכים כמקשה אחת, המוח האנושי מְאַגֵּם במהלך הקריאה את מה שקרא במעין "תקציר" המאפשר לו להבין את המשך הטקסט

חוקרים בטכניון גילו כי בניגוד למודלי שפה מלאכותיים, המנתחים טקסטים ארוכים כמקשה אחת, המוח האנושי מְאַגֵּם במהלך הקריאה את מה שקרא במעין “תקציר” המאפשר לו להבין את המשך הטקסט

LLMs (“מודלי שפה גדולים”), ובהם כמה “כוכבים” פופולריים כגון צ’אט GPT ו-Bard, חוללו בעשור האחרון מהפכה ביכולתן של מערכות ממוחשבות למלא משימות ולפתור בעיות. מודלים אלה בנויים ברובם על רשתות נוירונים מלאכותיות ועל למידה או אימון על סמך כמויות טקסט גדולות מאוד. כיום הם כבר מייצרים טקסטים, מתרגמים טקסטים משפה לשפה ואפילו מזהים סנטימנטים בטקסט נתון. כמו רשתות הנוירונים המלאכותיות, שהן הבסיס לבינה המלאכותית בכללה, גם  LLMsשואבים השראה מהמוח האנושי, אולם חשוב להכיר בהבדלים בין שני עולמות אלה. מחקר שנערך בטכניון ופורסם ב- Nature Communications מצביע על קווי הדמיון והשוני בין המוח למודלי שפה גדולים בהקשר ספציפי: הבנת טקסטים מושמעים.

פרופ' רועי רייכרט. (צילום : מיכל כהן)
פרופ’ רועי רייכרט. (צילום : מיכל כהן)

את המחקר הובילו פרופ’ רועי רייכרט וד”ר רפאל טיקוצ’ינסקי מהפקולטה למדעי הנתונים וההחלטות. זהו חלק מהדוקטורט של ד”ר טיקוצ’ינסקי, שנערך בהנחייה משותפת של פרופ’ רייכרט מהטכניון ופרופ’ אורי חסון מאוניברסיטת פרינסטון. במחקר שותפים ד”ר אריאל גולדשטיין מהאוניברסיטה העברית ויואב מאירי, סטודנט לתואר שני בפקולטה למדעי הנתונים וההחלטות.  

המחקר שנערך בטכניון מבוסס על סריקות fMRI – דימות תפקודי של המוח – ב-219 נבדקים בזמן שאלה הקשיבו לסיפורים. החוקרים בחנו את יכולתם של LLMs קיימים לנבא את הפעילות המוחית בזמן ההקשבה, וגילו כי הניבוי מוצלח רק כאשר מדובר בטקסטים קצרים – עשרות מילים לכל היותר. כאשר הטקסט ארוך יותר, מודלים אלה אינם מצליחים לנבא את הפעילות במוחו של האדם המקשיב.

טיקוצ’ינסקי ופרופ’ רייכרט הראו כי הסיבה לכישלון זה הוא בכך שבטקסטים ארוכים, המוח האנושי אינו מתנהג בדומה ל- LLMs. הדמיון בין השניים מתקיים בטקסטים קצרים, שבהם הן המוח והן המודל מעבדים את כל המילים שבקלט באופן מקבילי, כלומר בבת אחת; כאשר הטקסט ארוך, המודל המלאכותי ממשיך לעבד אותו באותו אופן, אך המוח – שאינו יכול “לעכל” אותו בשלמותו – עובר למוד אחר, “מנגנון צבירה”. פירוש הדבר הוא את הטקסט ששמע עד כה מְאַגֵּם המוח במעין “מצבור” של ידע הקשרי, ועל פיו הוא מפרש את המילים הבאות שישמע.

ד"ר רפאל טיקוצ'ינסקי
ד”ר רפאל טיקוצ’ינסקי

המודל המלאכותי, לעומתו, יכול “לעכל” בעת ובעונה אחת את כל הטקסט ששמע עד כה, ולכן הוא אינו נזקק לאותו מנגנון צבירתי. החוקרים הניחו כי הבדל מהותי זה הוא הסיבה לכשלונם של מודלים מלאכותיים בניבוי פעילות במוח המקשיב לסיפורים, ואף הדגימו זאת; הם פיתחו מודל מלאכותי משופר הפועל בדומה למוח.  מודל זה התבסס על תקצירים דינמיים של הטקסט שהושמע עד כה, ועל פיהם הוא פענח את המשך הטקסט. מודל זה אכן שיפר את ניבוי הפעילות המוחית, מה שמראה כי המוח המקשיב עוסק כל העת בסיכום של הטקסט הקודם ומתבסס עליו בהבנת המשך הטקסט. שיטה זו מאפשרת לנו לקלוט אינפורמציה מרובה שאנו מקבלים על פני זמן ארוך, כפי שקורה למשל בהרצאה שלמה, בספר שלם או בפודקאסט שלם. באמצעות אנליזה משלימה ערכו החוקרים מיפוי של אזורי מוח הממלאים תפקידים קריטיים הן בתהליכי עיבוד קצרים והן בארוכים, כפי שהם מראים באיור הבא. בחלק התחתון של האיור – האזורים המטפלים במקטעי הטקסט הקצרים; בחלק העליון – האזורים האחראים ל”צבירת ההקשר” המאפשרת לאדם להבין את המשך הטקסט על סמך הטקסט שהושמע עד אותה נקודה.

ממצאי המחקר מראים כי העיבוד ההיררכי במוח מאפשר אינטגרציה גמישה של מידע על ציר הזמן ומספקים תובנות משמעותיות הן לגבי מדעי המוח והן לגבי פיתוח בעולם ה-AI.

המחקר נתמך על ידי מלגת מל”ג ו-NIH.

למאמר ב- Nature Communication לחצו כאן