מדעי הסרקזם

הסטודנטית לוטם פלד מהפקולטה להנדסת תעשייה וניהול בטכניון פיתחה מערכת חדשנית המפרשת סרקזם בטוויטר

דוגמאות לציוצים סרקסטיים ולפירושים הכנים שהמערכת מייצרת באופן אוטומטי

דוגמאות לציוצים סרקסטיים ולפירושים הכנים שהמערכת מייצרת באופן אוטומטי

זיהוי אוטומטי של רגשות בטקסט הוא אתגר מורכב ביותר, המעסיק חוקרים רבים ברחבי העולם בשל הפוטנציאל העסקי הטמון בו והעניין המדעי שהוא מעורר. זיהוי רגשות עשוי לשמש ביישומים חברתיים, מסחריים ואחרים ולשפר את התקשורת בין אדם למחשב ובין אנשים המשתמשים ברשתות חברתיות.
למרות ההתפתחות העצומה בתחום זה, וההצלחות בניתוח רגשות (sentiment analysis), היישומים הקיימים אינם יודעים להתמודד עם לשון סגי נהור (סרקזם), ההופכת על פיה את כוונת הכותב. לדוגמה, אם נפרש ציוץ סרקסטי כמו  “הסרט החדש של מהיר ועצבני פשוט מצוין” (The new Fast and Furious movie is awesome) פשוטו כמשמעו, נפספס לחלוטין את מהות האמירה.
לוטם פלד, סטודנטית לתואר שני בפקולטה להנדסת תעשייה וניהול בטכניון, פיתחה מערכת שמטרתה לפרש אמירות סרקסטיות. המערכת, שפותחה בהנחייתו של פרופ’-משנה רועי רייכרט, קרויה sarcasm SIGN (Sarcasm Sentimental Interpretation GeNerator). לדברי פלד “אמנם קיימות הרבה מערכות שמטרתן זיהוי סרקזם, אבל זאת המערכת הראשונה בעולם המפרשת סרקזם בטקסט כתוב. אנחנו מקווים שבעתיד היא תסייע בין השאר לאנשים בעלי אוטיזם ותסמונת אספרגר המתקשים עם פירוש של סרקזם, אירוניה והומור.”

 

המערכת החדשה, המבוססת על תרגום מכונה (Machine Translation), הופכת משפטים סרקסטיים למשפטים כנים (שאינם סרקסטיים). את המשפט האמור, “הסרט החדש של מהיר ועצבני פשוט מצוין” היא תהפוך למשפט כן: “הסרט החדש של מהיר ועצבני הוא איום ונורא.”

כדי ללמד את המערכת לייצר את הפירושים האלה הרכיבו החוקרים בסיס נתונים ובו 3,000 ציוצים סרקסטיים, שתויגו ככאלה (#sarcasm) על ידי מחבריהם. לכל אחד מהציוצים “הוצמדו” חמישה פירושים לא סרקסטיים, שנכתבו על ידי בני אדם. המערכת אומנה על בסיס הנתונים הזה ובנוסף, אומנה לזהות מילים בעלות סנטימנט – למשל המילה Best בציוץ Best day ever – ולהחליף אותן במילים חריפות אשר חושפות את המשמעות הכנה של הכתוב, לדוגמה: Worst day ever. המערכת נבדקה על ידי שורה של שופטים אנושיים, ונמצא כי במרבית המקרים היא מייצרת משפט נכון הן מבחינה סמנטית והן מבחינה לשונית.

את המחקר תציג לוטם פלד בכנס יוקרתי בתחום עיבוד השפה – ACL 2017 – שייערך באוגוסט בוונקובר, קנדה.

למחקר המלא לחצו כאן

לוטם פלד

לוטם פלד

פרופ'-משנה רועי רייכרט

פרופ’-משנה רועי רייכרט