מספר אקראי

מתוך ויקיפדיה, האנציקלופדיה החופשית

מספר אקראי בתורת ההסתברות הוא מספר "מוגרל" מתוך טווח נתון ולפי התפלגות נתונה. זוהי תוצאת תצפית יחידה של משתנה מקרי בעל התפלגות כלשהי. כאשר ההתפלגות אינה מצוינת, מדובר בדרך כלל בהתפלגות אחידה בדידה, בה הסיכוי לקבלת כל ערך בטווח - שווה (כפי שמתקיים למשל בהטלת מטבע או בהטלת קובייה). כל התפלגות אחרת יכולה לשמש אף היא להגרלת ערך אקראי, ולמעשה תקבע את סיכויי ההגרלה.

במספרים אקראיים יש עניין בתחומים מדעיים רבים, בהם הדמיית אקראיות לצורך מחקר במדעי המחשב ובמדעים אחרים כמו תורת הכאוס, תורת המשחקים, תורת האינפורמציה, תורת ההסתברות ומכניקה קוונטית. כמו כן יש עניין בהם גם במשחקי מחשב, משחקי הימורים ובקריפטוגרפיה, בהם יש צורך לעיתים בהגרלת אלמנט או רצף אקראי של אלמנטים בהתפלגות אחידה מתוך קבוצה נתונה של האלמנטים או רצפים.

מספר אקראי אמיתי[עריכת קוד מקור | עריכה]

לא ניתן לקרוא למספר "אקראי" ללא הקשר כלשהו. לדוגמה: אם נתונים במכל 49 כדורים זהים הממוספרים מ-1 עד 49 ואם שולפים מתוך המכל (לאחר ערבוב הגון) כדור אחד ועליו מופיע המספר 23 ניתן לומר כי המספר 23 הוגרל באופן אקראי בהתפלגות אחידה מתוך הקבוצה . ההסתברות שהמספר 23 יוגרל היא . אם נרשום את המספר המופיע על הכדור, נחזירו למכל ונחזור על תהליך זה מספר פעמים, נקבל רצף אקראי המוגדר מעל הקבוצה . לדוגמה: הסיכוי שיוגרל הרצף: (בהנחה שכל כדור מוצא, נרשם ומוחזר שוב) היא או שהיא כפולה של ההסתברויות של כל כדורים ברצף.

מחוללים אקראיים[עריכת קוד מקור | עריכה]

דרך פשוטה להדגים מחולל אקראי היא על ידי הטלת קובייה או הטלת מטבע. למשל אם עץ שווה 1 ופלי שווה 0 ניתן להגריל בדרך זו מספר אקראי, בהנחה שהמטבע נוצרה באופן אחיד ואינה מוטה כלפי צד כלשהו. במקרה זה ההסתברות שיתקבל עץ בכל הטלה היא בדיוק חצי. מספר שהוגרל בדרך זו יקרא "אקראי אמיתי". בהטלות חוזרות של המטבע נוכל לייצר רצף סיביות אקראי אמיתי, בכל אורך שנרצה. אולם לשיטה זו אין ערך ממשי כאשר יש צורך ברצף אקראי מהיר ולעיתים קרובות. ניתן להגריל רצף אקראי אמיתי באמצעים פיזיקליים, על ידי מדידת תופעות פיזיקליות שונות כמו:

יצירת מחולל מספרים אקראיים "אמיתיים" היא תהליך מסובך ויקר הדורש חומרה ייעודית ואמצעים לביצוע ניסויים ובדיקות. קיימים מספר אתרי אינטרנט המציעים רצפים ארוכים של מספרים אקראיים אמיתיים, שנוצרו באחת השיטות המתוארות, הנגישים לגולשים לשימוש חופשי.

מבחנים סטטיסטיים[עריכת קוד מקור | עריכה]

מחוללים המבוססים על תופעות פיזיקליות כמו אלו המתוארות, אינם יציבים בדרך כלל ולרוב סובלים מהטיה סטטיסטית (Biased), כך שתוצאתם אינה אחידה. מבחינה מתמטית לא ניתן להוכיח שרצף הנוצר ממקור אקראי כלשהו הוא באמת אקראי. אולם ניתן באמצעות מבחנים סטטיסטיים מסוימים לבדוק את רמת האקראיות, על ידי איתור נקודות תורפה במחולל, שיכולות להצביע על אקראיות לקויה. מחולל אקראי יהיה בטוח רק אם ניתן להשתכנע בוודאות כי כל סיבית המופקת ממנו היא בהסתברות של חצי. אם למשל ההסתברות להגרלת סיבית 1 שונה מחצי אזי המחולל לא יהיה בטוח. ידוע על ניסיונות מוצלחים לניצול חולשות אלו על ידי מהמרים במשחקי הימורים. ישנן טכניקות לביטול ההטיה ושיפור האקראיות במקרים בהם תוצאת המחולל האקראי סובלת מהטיה, כמו בטכניקה הנקראת De-skewing.

ישנם מספר מבחנים סטטיסטיים בסיסיים, לבדיקת אקראיות. מבחן תדירות של סיביות בודדות, שבו נבדק האם מספר סיביות 1 זהה בקירוב לסיביות 0. מבחן סריאלי (זוגות סיביות) שבו בודקים האם מספר מופעי הזוגות (00,01,11,10) ברצף, אחיד פחות או יותר. מבחן פוקר, המבוסס על התפלגות כי בריבוע, שבו מחלקים את הרצף לתת-סדרות באורך מסוים ובודקים האם הם חוזרים על עצמם בהתפלגות שווה ברצף האקראי. מבחן רצף שבו בודקים האם ריצות רצופות של אפסים או אחדים באורכים שונים הם כצפוי מרצף אקראי ואוטו-קורלציה שהיא בדיקת מידת הקורלציה (רמת מתאם) בין הרצף הנבדק לבין היסטים שונים שלו.

מעבר לכך קיימות שיטות רבות לבדיקת אקראיות, בהן שיטת מאואר הנקראת "מבחן סטטיסטי אוניברסלי" המבוססת על הרעיון הבא, אם רצף כלשהו ניתן לדחיסה באופן משמעותי בעזרת אלגוריתם דחיסה כלשהו, הוא אינו אקראי. האלגוריתם של מאואר מנסה לבדוק את רמת הדחיסות של הרצף ובדרך זו לבחון את מידת אקראיותו, ככל ששיעור הדחיסות נמוך יותר מידת האקראיות גבוהה יותר. מבחנים נוספים נקראים מבחנים ספקטרליים המבוססים על התמרת פורייה ועל סיבוכיות ליניארית. ומבחן Diehard (שמרן), הוא סוללה של מבדקים סטטיסטיים שונים למדידת איכות של רצפים אקראיים, הידוע כאחד המבחנים היותר קפדניים. פותח על ידי ג'ורג' מרסגליה ב-1995.

גם אם המחולל עומד בהצלחה בכל מבחני האקראיות כמו אלו האמורים, אין בכך הוכחה מוחלטת לאקראיותו.

מספר פסאודו אקראי[עריכת קוד מקור | עריכה]

מרבית ההתקנים הפיזיקליים ליצירת מספרים אקראיים כמו אלו המתוארים לעיל, נוטים להיות יקרים מאוד ואיטיים ובמקרים מסוימים אף לא מעשיים. על כן הומצאו שיטות ליצירת מספרים פסאודו-אקראיים (מדומים) באופן דטרמיניסטימחשב), מתוך רצף אקראי קצר הנקרא גרעין (seed). רצף פסאודו-אקראי אינו אקראי אמיתי, אלא רק נראה לעין כאקראי, כאשר הגרעין ההתחלתי אינו ידוע. אולם בשל אופיים הדטרמיניסטי רצפים אקראיים שנוצרו בעזרת מחולל פסאודו-אקראי ניתנים לשחזור מדויק בהינתן הגרעין ההתחלתי. לעובדה זו שימושים מסוימים, שכן ניתן להעביר את הגרעין ההתחלתי ממקום למקום וליצור אותו הרצף במקום אחר.

תוצאת מחולל סיביות פסאודו-אקראי (PRBG) אינה אקראית לגמרי. למעשה עבור גרעין התחלתי באורך , מספר הרצפים שהמחולל מסוגל לייצר באורך מהווה רק חלק קטן מהטווח המקסימלי ליתר דיוק של כל הרצפים הבינאריים האפשריים באורך . השאיפה היא למצוא שיטה להרחבת גרעין התחלתי קצר לרצף באורך מרבי, באופן שלא ניתן יהיה להבחין בינו לבין רצף באורך זהה המיוצר בעזרת מחולל אמיתי. קיים מגוון עצום של אלגוריתמים ליצירת מספרים פסאודו-אקראיים מסוגים שונים. אולם רבים מהם אינם בטוחים ויש להיזהר בטענת הממציאים באשר לטיב אקראיותם.

אלגוריתמים אקראיים[עריכת קוד מקור | עריכה]

אלגוריתמים אקראיים עושים שימוש במספרים אקראיים. בזמן ריצה מבצע האלגוריתם החלטות בהתאם לערך אקראי כלשהו. בשל כך ייתכן מצב שבו האלגוריתם יחזיר תשובה שונה עבור קלט זהה. מסיבה זו נקראים אלגוריתמים אלו "אקראיים", בניגוד לאלגוריתמים דטרמיניסטיים, שעבור קלט זהה יבצעו תמיד אותן החלטות ותוצאתם תהיה תמיד זהה. דוגמה לשימוש במספרים אקראיים היא אלגוריתם מילר-רבין לבדיקת ראשוניות, שבמימושו הבסיסי נעשה שימוש במספרים אקראיים. אלגוריתם זה הוא אלגוריתם הסתברותי, כיוון שאינו מחזיר תשובה שנכונותה ודאית. השימוש באקראיות כשיטה לבדיקת ראשוניות יעיל יותר מאלגוריתמים דטרמיניסטיים מקבילים.

דוגמה נוספת לשימוש במספרים פסאודו-אקראיים היא שיטת מונטה קרלו, המשתמשת במספרים אקראיים לפתרון בעיות חישוביות.

מחולל פסאודואקראי (PRNG)[עריכת קוד מקור | עריכה]

אחת השיטות להפקת מספרים פסאודו-אקראי היא באמצעות פונקציה חד-כיוונית. הדוגמה הנפוצה למחולל כזה נקראת Linear congruential generator או בקיצור LCG שהומצאה על ידי Lehmer והפכה לתקן ANSI שיושם בעבר בפונקציה בשפת c. הרעיון הבסיסי של המחולל פשוט ויעיל ומתבסס על אריתמטיקה מודולרית, משוואתו היא: , כאשר גדול מאפס וערכו של הוא הגרעין ההתחלתי. הפרמטרים שולטים באופי התוצאה. בשל השימוש במודולו המחולל מייצר רצף סיביות סופי, כלומר מחזורי. כאשר לאחר מספר מסוים של אלמנטים המחולל חוזר על עצמו. מחזוריות המחולל היא על כן עניין קריטי, בחירת הפרמטרים עבור המחולל חשובה ולמעשה משפיעה ישירות על מחזוריותו. למשל אם אזי מחזוריות המחולל תהיה בערך . ישנן גרסאות משופרות ממשפחת אלגוריתמים אלו כמו אלגוריתם Park-Miller.

אף על פי שאלגוריתם זה עומד יפה במבחנים סטטיסטיים ידועים לבדיקת אקראיות וגרסאות שונות שלו נפוצות מאוד בשימוש מעשי, הוא אינו בטוח כלל מבחינה קריפטוגרפית. מאחר שהמשכו ניתן לניחוש מתוך רצף קצר יחסית. ג'ואן בויר, קראווציק ואחרים הראו כיצד ניתן לנחש את תוצאות מחולל מסוג זה מתוך רצף קצר (ללא ידיעת הגרעין ההתחלתי), בידיעת חלק מן הפרמטרים ואף בלא ידיעת הפרמטרים כלל. התיעוד המקיף ביותר בנושא זה הוא ספרו של דונלד קנות' "The art of computer programming" (כרך שני). ג'ון פון נוימן צוטט כאומר: "זהו חטא לחשוב כי ניתן לייצר מספרים אקראיים בשיטות מתמטיות".

איכות המחולל תלויה ביישום, בדרישות ובמטרה לשמה הוא משמש. משחקי מחשב למשל דורשים אקראיות נמוכה ביותר, עבורם מחוללים המובנים במהדר נפוץ מספקים. לעומתם משחקי הימורים דורשים אלגוריתמים טובים ומורכבים יותר. יישומים קריפטוגרפיים דורשים אקראיות מרבית. להלן הדרישות מכל מחולל פסאודו-אקראי (בסדר עולה של חשיבותן), כדי שיהיה בטוח:

  • הגרעין ההתחלתי יהיה ממקור אקראי אמיתי, ורצוי שיהיה סודי.
  • פלט המחולל יראה אקראי באופן שלא ניתן להבחין בינו לבין פלט מחולל אמיתי מבחינה סטטיסטית.
  • הגרעין ההתחלתי יהיה מספיק גדול כך שהפעלת כוח גס על כל האפשרויות תהיה בלתי מעשית.
  • פלט המחולל יהיה בלתי צפוי, באופן שלא ניתן לחישוב על ידי יריב בעל עוצמת חישוב מוגבלת.

שתי האחרונות נדרשות בעיקר ביישומים קריפטוגרפיים, למשל לצורך הכנת מפתחות הצפנה. כאמור, בחירת גרעין התחלתי אקראי (אמיתי) הכרחית. קיימים מספר מקורות אקראיים טובים להפקת גרעין התחלתי קצר, כגון:

  • שעון מערכת.
  • הפרשי זמן בין הקשות מקלדת או קואורדינטות העכבר.
  • תכולת אפיק קלט/פלט של המחשב.
  • קלט משתמש.
  • נתוני מערכת ההפעלה או תיעוד ביצועי רשת.

לעיתים משלבים מספר מקורות אקראיים באמצעות פונקציית ערבול בטוחה, להשגת אקראיות מרבית.

אלגוריתם פסאודודו אקראי קריפטוגרפי[עריכת קוד מקור | עריכה]

ערך מורחב – מחולל פסאודו אקראי קריפטוגרפי

מספרים אקראיים הם מרכיב חיוני במנגנוני הצפנה רבים. מפתחות הצפנה מיוצרים באופן אקראי כדי להקשות על ניחושם. פרוטוקולים ומנגנונים קריפטוגרפיים רבים משתמשים במספרים אקראיים למטרות שונות. מרבית האלגוריתמים הקיימים בשוק אינם עומדים בדרישות בטיחות מינימליות ואינם בטוחים מבחינה קריפטוגרפית כלל. אלגוריתם פסאודו-אקראי קריפטוגרפי מיושם בדרך כלל באמצעות אלגוריתם הצפנה בטוח. מאחר שאלגוריתמים להצפנה מכילים מטבעם את התכונה שהם קשים לניחוש, הם מהווים מקור מצוין לאקראיות. ישנן מספר שיטות להפקת רצף פסאודו-אקראי המתאים למטרות קריפטוגרפיות. בשיטות סימטריות משתמשים באלגוריתם סימטרי מהיר כגון AES בתור מחולל אקראי. בשיטה זו מצפינים ערך קבוע כלשהו (בדרך כלל אפסים), כאשר מפתח ההצפנה הוא הגרעין ההתחלתי. פלט הצופן מהווה חלק מהרצף האקראי. בשיטות א-סימטריות מפיקים רצף אקראי באמצעות נוסחאות הדומות לאלגוריתמים כגון RSA והצפנת רבין.

אלגוריתם BBS הוא דוגמה טובה למחולל בינארי אקראי-קריפטוגרפי המבוסס על הצפנה אסימטרית. המחולל פועל לפי הנוסחה: . בכל שלב הסיבית הנמוכה של מהווה חלק מהרצף האקראי, כאשר הוא כפולה של שני מספרים ראשוניים גדולים. ניסיון לנחש את הסיבית הבאה של המחולל שקול לניסיון לפרק את לגורמים. אם הגורמים הראשוניים של אינם ידועים, המחולל יהיה בטוח. מאחר שבטיחות המחולל תלויה בקושי שבפירוק לגורמים, רצוי ש- יהיה גדול ככל האפשר. החיסרון היחידי של האלגוריתם הוא שכל סיבית אקראית דורשת העלאה בריבוע מודולו , פעולה יקרה במונחי חישוב. ניתן לשפר את האלגוריתם בכך שפלט האלגוריתם בכל לולאה יהיה מספר מסוים של הסיביות הנמוכות של .

לקריאה נוספת[עריכת קוד מקור | עריכה]

דונלד קנות', The art of computer programming, Vol 2: Seminumerical Algorithms.

קישורים חיצוניים[עריכת קוד מקור | עריכה]