טיוטה:למידת מכונה אוטומטית

למידת מכונה אוטומטית (Automated Machine Learning, AutoML) היא תהליך האוטומציה של של יישום למידת מכונה על בעיות בעולם האמיתי. למידת מכונה אוטומטית עשויה לכלול כל שלב בהליך החל ממאגר נתונים גולמי ועד לבניית מודל למידת מכונה מוכן לשימוש. למידת מכונה אוטומטית הוצעה כפתרון מבוסס בינה מלאכותית לאתגר ההולך וגדל של יישום למידת מכונה.^[1] למידת מכונה אוטומטית שואפת לאפשר לכולם, ללא הכשרה מוקדמת, לעשות שימוש במודלים ובטכניקות של למידת מכונה מבלי לדרוש מהם להפוך למומחים בלמידת מכונה. טכניקות נפוצות בשימוש בלמידת מכונה אוטומטית כוללות אופטימיזציה של היפרפרמטרים, מטה-לרנינג וחיפוש ארכיטקטורה של רשתות עצביות מלאכותיות.

השוואה לגישה הסטנדרטית[עריכת קוד מקור | עריכה]

בלמידת מכונה טיפוסית, למומחים יש קבוצת נתוני קלט שישמשו לאימון המודל. אך ייתכן שהנתונים הגולמיים לא יהיו בצורה שניתן להחיל עליה את כל האלגוריתמים. לכן יש צורך להכין את הנתונים ללמידת המכונה על ידי מומחה שיצטרך ליישם שיטות עיבוד מקדים של נתונים, הנדסת תכונות, מיצוי תכונות ושיטות בחירת תכונות מתאימות. לאחר השלבים הללו, המומחה צריך לבצע לבצע בחירת אלגוריתם ואופטימיזציה של היפרפרמטרים כדי למקסם את הביצועים של המודלים. אם נעשה שימוש בלמידה עמוקה, הארכיטקטורה של הרשת העצבית חייבת להיבחר גם על ידי מומחה למידת מכונה.

כל אחד מהשלבים הללו עשוי להיות מאתגר, וכתוצאה מכך מכשולים משמעותיים לשימוש למידת מכונה. למידת מכונה אוטומטית מייעלת אוטומטית את כל תהליך למידת המכונה מטעינת נתונים, מידול ואיסוף דגמים. הוא בודק את אופן פעולתם של מודלים רבים של למידת מכונה ובחר אוטומטית את המודל הטוב ביותר בהתבסס על ערכי השגיאה הנמוכים ביותר: סטייה ממוצעת שיורית, טעות ריבועית ממוצעת (rmse), שגיאה ריבועית ממוצעת (mse), שגיאה ממוצעת (mae), ועוד.^[2] כמו כן, המשתמש יכול להגדיר מדד משלו לפי צרכיו. למידת ממכונה אוטומטית שואפת לפשט את השלבים הללו עבור לא מומחים, ולהקל עליהם להשתמש בטכניקות למידת מכונה בצורה נכונה ויעילה.

למידת מכונה אוטומטית ממלאת תפקיד חשוב בגישה הרחבה יותר של אוטומציה של מדעי הנתונים, הכוללת גם משימות מאתגרות כמו הנדסת נתונים, חקר נתונים ופרשנות מודלים.^[3]

מטרות של אוטומציה[עריכת קוד מקור | עריכה]

למידת מכונה אוטומטית יכולה להחליף שלבים רבים בתהליך למדית המכונה.^[1] חלק מהשלבים אותם ניתן להחליף הם:

הכנה והטמעת נתונים (מנתונים גולמיים ופורמטים שונים)
- זיהוי סוג עמודה; למשל, בוליאני, מספרי בדיד, מספרי רציף או טקסט
- זיהוי כוונת עמודות; למשל, יעד/תווית, שדה ריבוד, תכונה מספרית, תכונת טקסט קטגורית או תכונת טקסט חופשי
- זיהוי משימות; למשל, סיווג בינארי, רגרסיה, אשכולות, או דירוג
הנדסת תכונות
- בחירת תכונה
- חילוץ תכונה
- למידת מטא ולמידת העברה
- איתור וטיפול בנתונים מוטים ו/או ערכים חסרים
בחירת מודל - בחירה באיזה אלגוריתם למידת מכונה להשתמש, לרוב כולל מספר יישומי תוכנה מתחרים
Ensembling - צורה של קונצנזוס שבה שימוש במספר מודלים נותן לעיתים קרובות תוצאות טובות יותר מכל מודל
אופטימיזציית היפרפרמטרים של אלגוריתם הלמידה ותכונות תכונות
בחירת צינור תחת אילוצי זמן, זיכרון ומורכבות
בחירת מדדי הערכה ונוהלי אימות
בעיה בבדיקה
- איתור נזילות
- זיהוי תצורה שגויה
ניתוח התוצאות שהושגו
יצירת ממשקי משתמש והדמיות

לקריאה נוספת[עריכת קוד מקור | עריכה]

"Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI". Bizety. 2020-06-16.
Ferreira, Luís, et al. "A comparison of AutoML tools for machine learning, deep learning and XGBoost." 2021 International Joint Conference on Neural Networks (IJCNN). IEEE, 2021. https://repositorium.sdum.uminho.pt/bitstream/1822/74125/1/automl_ijcnn.pdf

הערות שוליים[עריכת קוד מקור | עריכה]

^ ¹ ² "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. נבדק ב-2018-03-28.
^ Rita Yi, Lingxi Song, Bo Li, M. James, Xiao-Guang Yue, Predicting Carpark Prices Indices in Hong Kong Using AutoML, Computer Modeling in Engineering & Sciences 134, 2022, עמ' 2247–2282 doi: 10.32604/cmes.2022.020930
^ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (במרץ 2022). "Automating Data Science". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256. {{cite journal}}: (עזרה)

קטגוריה:למידת מכונה

[AutoML2014ICML-1] ¹ ² "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. נבדק ב-2018-03-28.

[2] Rita Yi, Lingxi Song, Bo Li, M. James, Xiao-Guang Yue, Predicting Carpark Prices Indices in Hong Kong Using AutoML, Computer Modeling in Engineering & Sciences 134, 2022, עמ' 2247–2282 doi: 10.32604/cmes.2022.020930

[3] De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (במרץ 2022). "Automating Data Science". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256. {{cite journal}}: (עזרה)

[1]

[2]

[3]