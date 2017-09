מלאו כאן את כתובת האימייל

משפט ארו והצבעות הוגנות

היום אני רוצה לכתוב על משפט נהדר מתורת המשחקים שמצביע על מעין "חוסר הוגנות בלתי נמנע" בכל הצבעה "הוגנת". לפני שאני אתחיל לדבר על המשפט עצמו, אני רוצה לפתוח בדוגמה מציאותית יחסית.

בחירה הוגנת של גלידה נניח שאני ועוד ארבעה אנשים רוצים לקנות קופסת גלידה, ואנחנו צריכים להחליט איזה טעם אנחנו רוצים מתוך ארבע האופציות - שוקולד, וניל, תות או פיסטוק. לכל אחד מאיתנו יש את ההעדפות שלנו בנוגע לגלידה, אבל אנחנו צריכים להחליט ביחד על הטעם שנקנה. האם אפשר לעשות את זה באופן הוגן? האם יש דרך להחליט על טעם באופן הגיוני שישקף את ההעדפות של חמשתנו באופן שווה? במקרה שבו חמשתנו מעדיפים את אותם טעמים באותו סדר התשובה נראית די טריוויאלית, אבל מיד נראה שכל מקרה אחר יכול להניב כל מיני צרות. נתחיל בלשים לב לעובדה החשובה שלשיטת הבחירות שנבחר בה יש השפעה אדירה על התוצאה הסופית. יש כל מיני דרכים לשקלל העדפות של אנשים, וכל דרך יכולה להביא לתוצאה אחרת. בואו ניקח דוגמה לטבלה שמשקפת את סדר ההעדפות של כל שחקן ונראה שזה באמת נכון:



כל מספר מייצג את "המקום" של כל טעם בעיני אותו שחקן. למשל, ההעדפות של שחקן א' (מהגבוהה לנמוכה) הן - פיסטוק. תות, וניל ורק אז שוקולד (אכן בן אדם מוזר). כל מספר מייצג את "המקום" של כל טעם בעיני אותו שחקן. למשל, ההעדפות של שחקן א' (מהגבוהה לנמוכה) הן - פיסטוק. תות, וניל ורק אז שוקולד (אכן בן אדם מוזר). אז בואו נסתכל בטבלה ונראה לאילו תוצאות היא יכולה להוביל כתלות בכמה שיטות שונות שניתן לבחור לשקלול התוצאות: 1) אם נלך לפי שיטת "הרוב קובע", שבה הטעם שקיבל הכי הרבה מקומות ראשונים זוכה, הזוכה יהיה שוקולד (מפני שהוא המקום הראשון של שחקן ד' וה'). 2) אם נחליט שהזוכה יהיה הטעם שהדירוג הממוצע שלו הוא הכי גבוה (כלומר, סכום הנקודות שלו הכי נמוך), וניל יזכה, מפני שהוא מקבל בסך הכל 11 נקודות - פחות מכל טעם אחר. באופן דומה, ניתן למצוא הרבה שיטות הצבעה שונות שכל אחת מהן תשקלל את הנתונים באופן אחר ותביא למנצח אחר (ומיותר לציין שככל שמספר השחקנים והטעמים גדל, העניין נהיה יותר ויותר מורכב). כלומר, לשיטת הבחירות אכן יש חשיבות מכרעת בתוצאה שתתקבל. זו, אגב, חלק מהסיבה שמשום מה אחרי כל בחירות מרגיש שכמעט אף אחד לא באמת מרוצה.

איך נמצא שיטת בחירות הוגנת? מן הסתם, חשוב לנו ששיטת הבחירות שלנו תהיה כמה שיותר מוצלחת. כלומר - שהיא תהיה "יציבה" ותפתח צוהר לכמה שפחות ערפול בנוגע למנצח. לכן, כל הסיפור הזה מעלה את השאלה החשובה - האם קיימת שיטת בחירות הוגנת כזו? אני רוצה להדגיש - כשאנחנו מדברים על שיטת בחירות הוגנת, אנחנו מדברים על שיטת בחירות שתצליח להימנע מהחוסר עקביות שראינו פה למעלה. זו שאלה חשובה (ומורכבת), אבל לפני שנתחיל לענות עליה, אנחנו צריכים קודם כל להגדיר מהי בדיוק שיטת בחירות ולפי אילו קריטריונים אנחנו קובעים שהיא הוגנת ויציבה.

הגדרה א' - שיטת בחירות היא פונקציה שמקבלת בתור קלט את הדירוג של כל שחקן לכל אופציה (כלומר, רשימה מסודרת עם דירוג לכל אופציה, כמו בטבלה למעלה) ומחזירה בתור פלט רשימה מדורגת של האובייקטים שהשחקנים דירגו (כמו שראינו, הדירוג שהפונקציה תחזיר תלוי בפונקציה שנבחר בה). הגדרה ב' - שיטת בחירות תיקרא "הוגנת" אם היא מקיימת את שלושת הקריטריונים הבאים: 1) השיטה תכבד קונצנזוס. אם כל השחקנים דירגו את אופציה א' מעל אופציה ב', גם בדירוג הסופי א' תופיע מעל ב'. 2) השיטה תהיה "אדישה למניפולציות". כלומר, הדירוג היחסי של שתי אופציות לא אמור להשתנות בגלל שינויים בדירוגים של אופציות אחרות ולא רלוונטיות. למשל, אם הפונקציה שלנו קובעת ששוקולד קיבל דירוג גבוה יותר מפיסטוק, אז אנחנו רוצים שגם אם עקרונית האופציה של תות תבוטל, התוצאה הסופית עדיין תשקף את זה ששוקולד עדיף על פיסטוק (אנחנו לא מעוניינים שמניפולציות לא רלוונטיות כמו פרישה של מתמודדים ישנו את הדירוג היחסי של המתמודדים האחרים). 3) השיטה לא תהיה דיקטטורית. אסור שהבחירה של שחקן אחד תקבע את התוצאות, ללא תלות ברצונות של השחקנים האחרים.

נראה לי שאפשר להסכים שאלה קריטריונים מאוד הגיוניים ומובנים שאנחנו רוצים שיתקיימו בשביל שתהיה לנו שיטת בחירות הוגנת ויציבה. אז מה הבעיה? בדיוק בזה עוסק הפוסט. נציג את משפט ארו:

משפט ארו - במקרה של שלוש אופציות או יותר, לא קיימת שיטת בחירות הוגנת. כן, קראתם נכון. שיטת בחירות הוגנת לא קיימת. אנחנו עומדים להוכיח שהמקסימום ששיטת בחירות יכולה לקיים היא שתיים מתוך שלוש הדרישות, ולכן לעולם לא יכולה להיחשב הוגנת. אנחנו נעשה את זה בכך שנניח ששני הקריטריונים הראשונים מתקיימים, ונראה שכתוצאה מכך בהכרח קיים דיקטטור בקבוצה.

הוכחת משפט ארו זו הוכחה שיש בה הרבה דברים שצריך לעקוב אחריהם, אז יש מצב שיש חלקים ששווה להתעכב עליהם ולקרוא אותם יותר מפעם אחת (אפשר גם להוציא דף ועט כדי לעשות תרשימים שיבהירו בכל שלב בדיוק מה קורה). ההוכחה מורכבת משלושה חלקים: חלק א' - נוכיח כי תמיד קיים שחקן מכריע שיכול לשנות הצבעתו באופן שישנה את הדירוג הסופי של אופציה B ביחס לאופציה A כלשהי. כדי להבין למה, ניקח את המקרה הכי קיצוני ונדמיין שכולם דירגו את A במקום הראשון ואת B במקום האחרון (על פי כלל הקונצנזוס, A יופיע במקום הראשון ו-B במקום האחרון בדירוג הסופי). עכשיו נעמיד פנים שאנחנו מסדרים את n השחקנים שלנו בשורה מסודרת כך שאחד אחד, כל שחקן משנה את ההצבעה שלו כך ש-B מופיע מעל A. בסוף התהליך הזה, על פי כלל הקונצנזוס, הדירוג הסופי של B יהיה יותר גבוה משל A. אם בתחילת התרחיש B היה מדורג מתחת ל-A ובסופו הוא מדורג מעליו, אז מן הסתם איפשהו באמצע התהליך היה שחקן מכריע שההצבעה שלו בעד B שינתה את התוצאה הסופית (ושאם הוא לא היה מצביע בעד B אלא בעד A אז B היה נשאר בתחתית). נכנה את השחקן הזה k. אגב, שימו לב לתובנה החשובה הבאה - מפני שפונקציית הבחירה שלנו אדישה למניפולציות, המשפט הזה תופס לכל תרחיש שבו A דורג בהתחלה מעל B (לא משנה אם הם היו במקומות הראשונים והאחרונים), מפני שהתעלמות מהמתמודדים האחרים לא אמורה לשנות את הדירוג היחסי ביניהם. חשוב לציין שאותו שחקן k לא "בוחר" להכריע את התוצאות במקרה הזה, זה פשוט משהו שהתקבל בדיעבד כתוצאה מהבחירות שלו ושל הקבוצה (באותה מידה, כל שחקן אחר יכול להיות המכריע בין A ל-B, הוא פשוט צריך להיות המצביע שמטה את לשון המאזניים). חלק ב' - נוכיח כי השחקן המכריע k הוא דיקטטור על הדירוג של B מעל אופציה C כלשהי. כלומר - הדירוג היחסי שהוא יבחר עבור אופציות B ו-C חייב להישמר בתוצאה הסופית. נסתכל על התרחיש הבא - כל שחקן עד השחקן k-1 (כולל) מדרג את B מעל C ואת C מעל A, השחקן המכריע k מדרג את A מעל B ואת B מעל C ובנוסף כל שארית השחקנים החל מ-k+1 ועד השחקן האחרון n מדרגים את A מעל B ואת B מעל C. נשים לב שהתרחיש הזה דומה מאוד לתרחיש הראשון, רק שדחפנו פנימה את האופציה הלא רלוונטית של C. מפני שפונקציית הבחירה שלנו אדישה למניפולציות, אפשר להתייחס אל זה כעל תרחיש דומה כמעט לגמרי לקודם. (הדירוגים הנוכחיים) מפני שבתרחיש הזה השינוי הקל הוא שהשחקן המכריע k בחר להעדיף את A על B (בשונה מבתרחיש א'), אנחנו יודעים ש-A יופיע מעליו בתוצאה הסופית. בנוסף, כתוצאה מכלל הקונצנזוס (B תמיד מדורג מעל C), אנחנו יודעים שבתוצאה הסופית B יהיה מדורג מעל C. אם כן, בתוצאה הסופית A יהיה מעל B ו-B יהיה מעל C - הסדר הוא A ראשון, B שני ו-C שלישי. עכשיו נראה שבבת אחת השחקן k קיבל את כל העוצמה, ושלא משנה מה יעשו שאר השחקנים, הדירוג הסופי ייקבע על ידו. כעת, נניח שהשחקן המכריע k מחליט לשנות את הדירוג שלו כך ש-A יהיה מתחת ל-B (אבל הדירוג של C לא משתנה). במקביל, נניח שכל(!) שאר השחקנים מחליטים לשנות את הדירוג שלהם כך ש-B יופיע מתחת ל-C. עכשיו התרחיש באמת יהיה זהה לחלוטין לתרחיש הראשון (שוב, אם מעמידים פנים שאופציה C לא שם, וזה מותר כי הפונקציה אדישה למניפולציות), שבו הדירוג הסופי של B היה מעל הדירוג הסופי של A. מעבר לכך, הדירוג הסופי של A צריך להיות מעל הדירוג הסופי של C, מפני שעכשיו הדירוג היחסי של A ו-C הוא זהה לדירוג היחסי של B ו-A (הסתכלו בתרשים למטה - ניתן לראות שבשני המקרים השחקן k מכריע את הדירוגים). אם כן, הדירוג המעודכן הוא B ראשון, A שני ו-C שלישי.

(הדירוגים החדשים) אם כן, למרות העובדה שכל(!) שאר השחקנים חוץ מ-k לא דירגו את B במקום הכי גבוה, הוא יופיע בסופו של דבר במקום הכי גבוה. באותו אופן, אפילו שרק k דירג את A באמצע, גם בתוצאות הסופיות הוא יופיע באמצע, ואפילו שרק k דירג את C במקום הכי נמוך, בסופו של דבר הוא יופיע במקום הכי נמוך. אבל זו בדיוק ההגדרה של דיקטטור - לא משנה מה עושים השחקנים האחרים, הוא זה שקובע את התוצאה הסופית! (הערה - מן הסתם הדירוגים היחסיים יישארו זהים גם אם נוסיף אופציות נוספות מלבד A, B ו-C, מפני שהפונקציה שלנו אדישה למניפולציות. אם כן, ניתן להראות ש-k הוא דיקטטור עבור כל מספר של אופציות)

חלק ג' - נראה שהשחקן המכריע k הוא הדיקטטור היחיד. מי שקרא עד עכשיו אמנם יכול לראות ש-k דיקטטור בתרחיש שהצגתי, אבל אפשר בקלות לשאול - "איך אנחנו יודעים שבשלב כלשהו לא יהיה שחקן מכריע נוסף? אולי השחקן המכריע בחלק ב' הוא לא אותו שחקן מכריע כמו בחלק א'? במצב כזה, יהיה בכלל דיקטטור?". בשלב הזה אנחנו נראה שהתרחישים שהתייחסנו אליהם בחלקים א' וב' הם מספיק כלליים בשביל לתפוס לגבי כל שיטת בחירות הוגנת, ושתמיד יש חפיפה בין השחקנים המכריעים כך שיש דיקטטור אחד בלבד. החלק הזה הוא טכני יחסית (ואני לא אכתוב אותו במלואו), אבל מילת המפתח שלנו היא שאנחנו עובדים ללא הגבלת כלליות. כל התרחישים פה דומים אחד לשני וניתן להגיע בקלות מתרחיש אחד לאחר על ידי החלפת השמות של האופציות A, B, C (זה בוודאי לא משנה את התהליך עצמו). גם הצלחנו כבר לראות שכל הטיעונים שלנו תופסים לגבי כל כמות של אופציות (כי הפונקציה שלנו אדישה למניפולציות). כשמשלבים את כל אלה ביחד, אנחנו רואים שזה בכלל לא משנה איזו אופציות אנחנו בוחרים בתור A ו-B לחלק א', כי תמיד השחקן המכריע הוא אותו שחקן והדיקטטור הוא אותו דיקטטור. ובזאת תמה ההוכחה.

אז סיכום ההוכחה במשפט וחצי - בשלב הראשון מראים שהתכונות של פונקציית הבחירות מחייבות שיהיה שחקן שיכריע בין שתי אופציות. בשלב הבא מראים שאותו שחקן יכול "להשתמש בסמכות שלו" כדי להכריע את הדירוג של אופציה נוספת. לבסוף, מרחיבים את הרעיון ומראים שהשחקן יכול להכריע את הדירוג הסופי של כל אופציה ברשימה, ללא תלות בשינויים בבחירות של השחקנים האחרים. סיכום וקצת קשקושים פילוסופיים למי שהצליח לעקוב - כל הכבוד (אפילו אני קראתי את ההוכחה פעמיים אחרי שכתבתי אותה פה כדי לוודא שהכל באמת הגיוני חח). המסקנה המדהימה של המשפט שהוכחנו עכשיו היא שכל מערכת בחירות "הוגנת" (כלומר, מערכת בחירות שמכבדת קונצנזוס ואדישה למניפולציות) חייבת להיות למעשה לא הוגנת בעליל - היא תכלול שחקן אחד ("הדיקטטור") שבסופו של דבר יקבע את התוצאה הסופית, בלי קשר לבחירות של השחקנים האחרים. זו תוצאה מעניינת ולא טריוויאלית, אבל עד כמה היא באמת משמעותית? אם נחשוב על זה לעומק, נשים לב שגם ככה נדיר מאוד שאנחנו משתמשים בשיטות בחירות שמקיימות גם את תנאי הקונצנזוס וגם את האדישות למניפולציות. למען האמת, התנאי של אדישות למניפולציות נדיר מאוד בשיטות הבחירות שאנחנו משתמשים בהן. בואו נסתכל שוב על דוגמת הגלידה שלנו; אם נבחר בשיטת "הרוב קובע" (כלומר, הטעם המנצח הוא זה שקיבל הכי הרבה מקומות ראשונים) אז שוקולד מנצח את וניל. לעומת זאת, אם נפעיל את המניפולציה של ביטול האפשרות לבחור בפיסטוק או תות, אז וניל ינצח את שוקולד. אפילו שזו אחת משיטות הבחירה הכי פופולריות כיום, ניתן לראות שהיא מאוד רגישה למניפולציות. ניתן לחשוב על אלף ואחד מקרים שבהם דברים כאלה קורים - אדם שלא מצביע מפני שהוא לא מאמין שהמפלגה שהוא תומך בה תעבור את אחוז החסימה, מפלגות חדשות וקטנות שלוקחות מנדטים ממפלגות שבכל סיטואציה אחרת היו מצליחות להשיג רוב, אנשים שמצביעים למפלגה שהם לא לגמרי תומכים בה רק כדי שתוכל לנצח את המפלגה שהם הכי שונאים וכו'. בשורה התחתונה - יכול להיות שהדרישות שלנו משיטת הבחירות היו לא כל כך מציאותיות. בנוסף, גם אם נניח שכן נבחר להשתמש בשיטת בחירות "הוגנת", חשוב להזכיר (כמו שאמרתי בסוף חלק א' של ההוכחה) שהדיקטטור לא באמת "בוחר" להיות הדיקטטור - הוא פשוט תוצר לוואי של התפלגות ההעדפות של הקבוצה. זה שהוכחנו שהדיקטטור תמיד קיים, לא אומר שקל למצוא אותו או שבאמת יש לו אפשרות להשפיע באופן ברור (ראינו שגם ככה כדי למצוא את הדיקטטור בהוכחה היינו צריכים לחשוב על כל תרחיש אפשרי כמעט, אז קשה להאמין שמישהו יוכל במודע להביא את עצמו למעמד של דיקטטור ולנצל אותו לרעה). אתגר לקוראים - הניחו שפונקציית הבחירות שלכם מקיימת את כלל הקונצנזוס והאדישות למניפולציות, ונסו לאתר את הדיקטטור בסיפור הגלידה מתחילת הפוסט.

נ.ב - יש קשר מעניין בין תנאי הקונצנזוס של פונקציית הבחירות לבין אחד המונחים שדיברתי עליהם בפוסט הקודם שעסק בתורת המשחקים. פרס מובטח למגיב שיצליח להגיד לי על איזה מונח אני מדבר ומה הקשר! _____________________________________________________________________ אז עכשיו אחרי שקראתם את הפוסט, מה דעתכם? מעדיפים שיטת בחירות הוגנת (אבל עם דיקטטור שמסתתר מתחת לפני השטח), או שאתם מעדיפים את שיטות הבחירות הרגילות שמוציאות את כולם קצת מבואסים? מקווה שהיה לכם מעניין לקרוא. ההוכחה היום דרשה לא מעט חשיבה לוגית, ולכן אם יש צורך בהבהרות כלשהן (או חלילה תיקונים) מוזמנים להגיד לי. אגב, קיימות עוד הוכחות יפות של המשפט, אם מישהו מעוניין בקישורים למאמרים, אשמח לספק. שיהיה שבוע מעולה! :)

מתמטיקה

נכתב על ידי קרל שוורצשילד , 23/9/2017 17:16 בקטגוריות הוכחות