X-fast trie

X-fast trie
יצירה
הומצא ב:	1982
ממציא:	דן ווילארד
סיבוכיות מקום וזמן
ממוצע	במקרה הגרוע

במדעי המחשב, X-Fast trie הוא מבנה נתונים המאחסן מספרים שלמים מטווח נתון. מבנה הנתונים מתבסס על עצים וטבלאות גיבוב. מבנה הנתונים נחשב מהיר במיוחד מאחר שהוא מאפשר לבצע שאילתות בסיבוכיות זמן $O(\log \log M)$ ועל ידי שימוש בסיבוכיות מקום של $O(n\log M)$ , כאשר n מסמן את מספר הערכים בעץ ו-M את טווח הערכים שהעץ יכול להכיל. על מנת לתת אינטואיציה כמה הפונקציה $\log \log$ גדלה לאט, מתקיים $\log _{2}\log _{2}(10^{10})\approx 5$ . בזמן פרסום המאמר, ווילארד הציג גם מבנה נתונים יעיל יותר בשם Y-fast trie.

הקדמה[עריכת קוד מקור | עריכה]

Trie[עריכת קוד מקור | עריכה]

ערך מורחב – Trie

Trie הוא מבנה נתונים פשוט הנועד לאחסון מחרוזות. ניתן לראות במספר טבעי כמחרוזת, לפי הייצוג הבינארי שלו. הרעיון יהיה לשמור את הערכים ב-Trie של ביטים.

טבלת גיבוב[עריכת קוד מקור | עריכה]

ערך מורחב – טבלת גיבוב

טבלת גיבוב היא מבנה נתונים המאפשר הכנסה, הוצאה וחיפוש בזמן ממוצע של $O(1)$ , וסיבוכיות מקום ליניארית. עבור X-fast trie אנחנו מניחים טבלת גיבוב מושלמת, כלומר, מתעלמים מה-worst case.

מבנה[עריכת קוד מקור | עריכה]

X-Fast trie הוא Trie בינארי משורשר בו העלים מחוברים ברשימה מקושרת דו כיוונית, וכל הצמתים בכל שלב מאוחסנים בטבלת גיבוב.

Trie בינארי משורשר הוא עץ בינארי המקיים

כל צומת 0 שחסרה, יהיה מצביע לאיבר הקודם בסריקת inorder^[1]
כל צומת 1 שחסרה, יהיה מצביע לאיבר העוקב בסריקת inorder

למצביעים אלה נקרא חוטים

ב-X-Fast trie נבדיל בין צמתים לעלים. כל הערכים יאוחסנו בעלים, בעוד הצמתים נועדו אך ורק לנווט בתוך העץ. לא נשמור צמתים פנימיים אם אין לאותו צומת צאצאים שהם עלים. בכל דרגה של העץ נשמור טבלת גיבוב בה יש את כל הצמתים של אותה דרגה. על מנת שנוכל להבטיח את זמן הריצה הגרוע של השאילתות, נשתמש בגיבוב דינמי מושלם או בגיבוב קוקייה.

פעולות[עריכת קוד מקור | עריכה]

הצצה[עריכת קוד מקור | עריכה]

על מנת לבדוק האם מספר (או מפתח) x נמצא בעץ, פשוט נחפש בטבלת הגיבוב של העלים. לכן ניתן לוודא קיום של מפתח בזמן $O(1)$ .

עוקב וקודם[עריכת קוד מקור | עריכה]

בX-fast trie ניתן למצוא עוקב לאיבר x בטווח בזמן $\log \log M$ .

נחפש את התחילית הארוכה ביותר של x שנמצאת בעץ. אם זה עלה נתקדם לערך הבא. אם זה צומת אזי קיים מצביע לאחד העלים ^[2]. נעקוב אחרי המצביע הזה, ונחזיר את הערך שהגענו אליו או את זה שאחריו, תלוי בערך של x כמובן.

על מנת שנוכל למצוא את התחילית במהירות, נבצע חיפוש בינארי, כלומר נחפש בטבלת הגיבוב האמצעית את התחילית באורך חצי, אם היא לא קיימת אז נלך לדרגה h/4, ואם היא קיימת נתקדם לדרגה 3h/4. ההמשך כמו חיפוש בינארי רגיל.

הכנסה[עריכת קוד מקור | עריכה]

על מנת להכניס ערך x, צריכים

להוסיף מספר צמתים חדשים ל-Trie
לחבר את x לרשימה המקושרת הדו כיוונית של העלים
לעדכן את החוטים שיכללו את x

הזמן במקרה הגרוע הוא $\Omega (\log M)$ בגלל השלבים הראשון והשלישי.

אלגוריתם להכנסה[עריכת קוד מקור | עריכה]

אלגוריתם זה תומך בזמן הכנסה משוערך של $O(\log M)$

הכנסה (קלט: x)

מצא את העוקב של x
הוסף את x ל-Trie
הכנס את x לרשימה המקושרת על ידי העוקב שמצאנו מקודם
תעלה במעלה העץ מ-x, העוקב והקודם שלו, ועדכן את החוטים

מחיקה[עריכת קוד מקור | עריכה]

באופן מאוד דומה להכנסה, מחיקה לוקחת זמן משוערך של $O(\log M)$

אנחנו צריכים

למחוק את x מה-Trie
להוציא את x מהרשימה המקושרת של העלים
לעדכן את כל החוטים הרלוונטיים

הערות שוליים[עריכת קוד מקור | עריכה]

^ הכוונה ב'צומת 0 שחסרה' היא צומת ללא בן שמאלי, 'צומת 1 שחסרה' מוגדר באופן אנלוגי
^ שהרי אם היו 0 ילדים אזי זה עלה, אך אך אם יש שני ילדים אז ניתן להמשיך לתחילית ארוכה יותר

.

[1] הכוונה ב'צומת 0 שחסרה' היא צומת ללא בן שמאלי, 'צומת 1 שחסרה' מוגדר באופן אנלוגי

[2] שהרי אם היו 0 ילדים אזי זה עלה, אך אך אם יש שני ילדים אז ניתן להמשיך לתחילית ארוכה יותר

[1]

[2]

מבני נתונים
מבנים מופשטים	רשימה • מחסנית • קבוצה • מולטי קבוצה • תור • דו-תור • תור עדיפויות • מילון • מחרוזת • איחוד קבוצות זרות
מימושים ליניאריים	מערך • מערך משונן • טבלת גיבוב • רשימה מקושרת • רשימת דילוגים • חוצץ
גרפים ועצים	ערימה (בינארית • בינומית • פיבונאצ'י) • עץ חיפוש (עץ אדום שחור • עץ 2-3 • עץ 2-3-4) • עץ סיפות • עץ B • עץ +B • עץ AVL • עץ Splay • עץ BSP • עץ kd • עץ R‏ • Trie • טריי X מהיר • טריי y מהיר• עץ WAVL
הסתברותיים	מסנן בלום