סטודנטים בטכניון פיתחו מערכת לחיזוי תוצאות הצבעה בכנסת

כנסת ישראל

כנסת ישראל

המערכת הצליחה לנבא בדיוק של כ-80% את הצבעותיהם של חברי הכנסת,  ובכ-67% את אלו של המפלגות.

סטודנטים בטכניון פיתחו מערכת לחיזוי תוצאות הצבעה בכנסת. את המערכת הייחודית פיתחו הסטודנטים יגאל  קרייצ'מן ונדיר יזרעאל, סטודנטים לתואר ראשון בפקולטה למדעי המחשב בקורס בינה מלאכותית, בהנחייתו של פרופסור שאול מרקוביץ. השניים יצרו מערכת ממוחשבת המנבאת, על סמך פרמטרים שונים מהצבעות עבר, כיצד יצביעו חברי הכנסת כיחידים והמפלגות כקבוצות על הצעות חוק שונות.

התוכנה אף חוזה, לפי אותם פרמטרים, כיצד יצביעו הח"כים והמפלגות על הצעות חוק עתידיות, אפילו כאלה שטרם נכתבו. הרעיון, אומרים יזרעאל וקרייצ'מן, היה לבנות מודל שיאפשר למי שייגש לכתוב הצעת חוק חדשה לדעת כיצד יצביע עליה כל ח"כ וח"כ. לדבריהם, זהו כלי "שיהיה ניתן להיעזר בו עוד בשלב כתיבת הצעת החוק, כדי לשפר את סיכוייו של החוק לעבור."

יזרעאל מספר כי כשהחליטו השניים לבחור פרויקט מתחום הלמידה החישובית, הם חיפשו "רעיון שיהיה מיוחד ומאתגר, ושיהיה לנו מידע זמין עבורו." לדברי קרייצ'מן, "חיפשנו נושא שיש בו מאגר מספיק גדול של תשובות קיימות על שאלה כלשהי, כך שבכל פעם שהמערכת תענה על שאלה, נוכל לבדוק מול המאגר אם התשובה אכן נכונה."

את המאגר המבוקש מצאו קרייצ'מן ויזרעאל באתר האינטרנט "כנסת פתוחה", מיזם שנבנה ומתוחזק בידי עמותת מתנדבים בשם 'הסדנה לידע ציבורי'. זהו אתר המנגיש לציבור מידע ונתונים על פעילות הכנסת – כולל, כמובן, פירוט החקיקה המתבצעת בכנסת ופרטי הצבעות הח"כים והמפלגות על הצעות החוק בשלביהן השונים.

למאגר ההצבעות באתר 'כנסת פתוחה' יש יתרון נוסף, מעבר לגודלו, והוא קשור באחת השיטות ליצירת מודל חיזוי על ידי שימוש בלמידה מתוך דוגמאות. בשיטה זו נבנה מודל הלוקח אחוז מסוים של דוגמאות מהעבר – במקרה הזה הצעות חוק שעברו בכנסת הקודמת – לומד אותן ומבצע על פי תוצאותיהן סימולציית-חיזוי לגבי דוגמאות העבר שאליהן טרם נחשף. השוואת תוצאות אלה לתוצאות האמיתיות מאפשרת הערכה של רמת הדיוק של החיזוי הממוחשב.

כדי שתוכנה תוכל ללמוד מתוך דוגמאות, צריך לדעת להגדיר נכונה את התכונות שעליה ללמוד. כשמדובר באיפיון הצבעות על חקיקה, מדובר בשורה ארוכה ומורכבת של תכונות, משום ששיקולי ההצבעה – בפוליטיקה בכלל ובזו הישראלית בפרט – רבים ומרובדים. עוד יתרון שסיפק האתר, לפיכך, הוא פילוחים נושאיים ותוכניים של הצעות החוק השונות. האתר

מסמן את ההצעות הן על סמך 'תיוגים' – שיטה הממיינת את החוקים לפי נושאיהם – והן על סמך 'אג'נדות' –  כלומר לפי השאלה אם החקיקה מקדמת את הנושא האמור (זכויות אדם, למשל) או פוגעת בו.

הסטודנטים מספרים על האתגרים הרבים שניצבו בפניהם. כך, למשל, היה צריך להכניס למערך השיקולים את העובדה שהתיוגים אינם תמיד מדויקים. עניין נוסף הוא הפער בין נוסח הצעת החוק שהוגשה לכנסת  לבין זו שהגיעה להצבעה בקריאה שלישית – פער שיכול לשנות את האג'נדה של החוק, עד כדי כך שבמקרים מסוימים, ח"כים שהגישו הצעות חוק הצביעו בסופו של דבר נגדן. גורמים נוספים שנלקחו בחשבון – לחצים קואליציוניים, שיקולים אישיים של ח"כים ומעברים של ח"כים ממפלגה למפלגה ושל מפלגות מקואליציה לאופוזיציה ולהיפך, משפיעים עמוקות על תוצאות ההצבעות.

בנוסף, נטייתם של הפרלמנטרים הישראלים להיעדר מהצבעות עלולה אף היא להוביל להטיות סטטיסטיות. בממוצע, מצאו קרייצ'מן ויזרעאל, מגיעים לכל הצבעה על  חוק 19.95 ח"כים – פחות משישית מכלל חברי הכנסת. קרייצ'מן ויזרעאל שקלו לסווג אי-הגעה כתמיכה בתוצאותיה הסופיות של ההצבעה על החוק.

כדי להתגבר על שלל הבעיות עשו הסטודנטים שתי פעולות מרכזיות. האחת, הם מיצעו את שורת ההצבעות של כל ח"כ על שלבי החקיקה השונים של כל חוק. השנייה, הם זיווגו  שורה של תכונות בין כל אחת מהצעות החוק  לבין כל ח"כ וכל מפלגה (למשל: שייכות לקואליציה או לאופוזיציה, השתתפות בכתיבת הצעת החוק, הצבעת ח"כים אחרים מאותה מפלגה עבור האג'נדה והתיוג שלפיו מסווג החוק). את הזיווגים הם הריצו על אלגוריתמי למידה שונים וכך הסיקו אילו תכונות מאפשרות רמת חיזוי טובה, וכן אילו אלגוריתמים מבצעים באמצעותן את העבודה המדויקת ביותר. אחד הממצאים המעניינים, לדברי  קרייצ'מן ויזרעאל: בשעה שאלגוריתם מסוג מסוים, עץ החלטה למשל, יכול לבצע חיזוי מצוין למפלגה מסוימת, הרי שלמפלגה אחרת יתאפשר ניבוי מוצלח רק בעזרת אלגוריתם אחר, למשל – אלגוריתם סטטיסטי.

המערכת שפיתחו הצליחה לנבא בדיוק של כ-80% את הצבעותיהם של חברי הכנסת,
ובכ-67% את אלו של המפלגות. ממצא מעניין נוסף שעלה –  לח"כים הישראלים יש משמעת סיעתית חזקה במיוחד, ושהזאבים הבודדים שלא יצביעו ב-99% מהמקרים כמו שאר חברי מפלגתם, מעטים ביותר.

״זהו פרויקט קלאסי של סטודנטים מצטיינים״, אומר פרופסור מרקוביץ.  ״הסטודנטים איתרו את מאגר הנתונים המסקרן הזה, ניתחו אותו, פיתחו מאפיינים מעניינים והפעילו אלגוריתמי למידה מדוגמאות.  התוצאות הראשוניות מעודדות, ונראה שניתן בעבודה נוספת אף לשפר את דיוק החיזוי של המערכת.״