משתמש:דני י'/טיוטה

מתוך ויקיפדיה, האנציקלופדיה החופשית
דף זה אינו ערך אנציקלופדי
דף זה הוא טיוטה של דני י'.
דף זה אינו ערך אנציקלופדי
דף זה הוא טיוטה של דני י'.


שיטת משחק פיקטיבי של בראון[עריכת קוד מקור | עריכה]

בערך זה נקרא לאסטרטגיות במשחק G פעולות, כלהבדיל מאסטרטגיות במשחק החוזר. ראה משחק חוזר.

נתאר שיטה שמיועדת לשפר תוצאות משחק G מעבר לתוצאות שמתקבלות כשמשוחקת וקטור פעולות .[1] חזרה על G כשמתחילים ב- זאת מערכת עם מצב המתפתחת הלוך זמן בדיד בהשפעת G - בכל זמן t השחקנים בודקים איך G הגיבה להם בעבר ועל סמך הבחנותיהם מחשבים איזה פעולה לעשות בזמן t. בבמט זה, יש ב- מידע על המבנה של G. אפשר לנסות להשתמש במידע הזאת כדי לשפר את תוצאות המשחק G. אולי לזה התכוון בראון במונח "משחק פיקטיבי" שהוא המציא בתיאור שיטה כזאת עם וקטור אסטרטגיות מסוים.[2] אולי התואר "פיקטיבי" מתיחס למשחקים שמבטאים מצבים במצאיות בהם חזרה על המשחק אינה מעשית, שאז החזרות על המשחק יכולות להתקבל בתור הדמיה ממוחשבת. אע"פ שבראון השתמש בווקטור אסטרטגיות מסויימת, ייתכן שהרעיון יניב אלגוריתמים יותר יעילים כשבהם וקטור האסטרטגיות יותר מורכב.

האסטרטגיה של בראון[עריכת קוד מקור | עריכה]

במאמרו בראון מתאר את זה בתור האסטרטגיה של סטטיסטיקאי שבזמן t מעריך את משחק כל שחקן i בתור ההתפלגות של הפעולות שלו בעבר . בזמן t השחקן בוחר פעולה טהורה המהווה אופטימום לפונקציית הרווח שלו באותו רגע. בראון מציע שכשכל השחקנים משחקים לפי אסטרטגיה זו, מתכנסת לפתרון המשחק. שני פירושים לזה - א' התכנסות לווקטור פעולות אופטימליות. ב' התכנסות לערך המשחק.

ניתוח שיטת בראון[עריכת קוד מקור | עריכה]

שיטת בראון נחקרה מאז שהוא הציע אותה ועד 1999 לפחות. להלן שני תוצאות שמעידות על השימוש והמגבלות של השיטה.

רובינסון 1951[3][עריכת קוד מקור | עריכה]

רובינסון (בלועזית Robinson) מציגה הוכחה שמשחק פיקטיבי לפי האסטרטגיה המקורית של בראון מקרבת את ערך המשחק. האם מכאן נובעת התכנסות לווטקור פעולות אופטימאליות? המשפט מתיחס רק למשחקים שני שחקנים סכום 0.

שייפלי 1963[4][עריכת קוד מקור | עריכה]

שייפלי (בלועזית Shapley) מציג משפחה רחבה של משחקים 3x3 שאינם סכום 0 בה אין התכנסות של סדרת תוצאות המשחקים בשיטת בראון, ואף לא תת-גבול שהוא שיווי משקל של המשחק החד-שלבי. משפחת המשחקים מוגדרת ע"י מספר אי-שיוויונות לינאריים באיברי מטריצת המשחק. מאמר מ-1998 בא להראות שזה נכון ברוב המשחקים שאינם סכום 0.[5]

מקורות[עריכת קוד מקור | עריכה]

  1. ^ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם e
  2. ^ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם a
  3. ^ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם b
  4. ^ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם c
  5. ^ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם d


[1]

[2]


[3]


[4]


[5]


</refrerences>

  1. ^ ליתר דיוק, שיפור זאת דרישה כלשהיא על ווקטור התוצאות. לדוגמה, בשביל שחקן 1 שיפור יכולה להיות הדרישה והרווח שלו יגדל. בשימוש אחר שיפור יכול להיות שוקטור הפעולות הוא -שיווי משקל.
  2. ^ George W. Brown, "Iterative Solution of Games by Fictitious Play", Activity Analysis of Production and Allocation, 1951 John Wiley & Sons
  3. ^ Julia Robinson, "An Iterative Method of Solving a Game", The Annals of Mathematics Vol. 54 No. 2, 1951
  4. ^ Loyd S. Shapley, Some Topics in Two Person Games, Memorandum RM-3672-PR, The RAND Corporation, 1963
  5. ^ Krishna and Sjöström, "On the Convergence of Fictitious Play", Matheamtics of Operations Research" Vol. 23 No. 2, 1998