Stable Diffusion

מתוך ויקיפדיה, האנציקלופדיה החופשית
Stable Diffusion
תמונה שנוצרה באמצעות Stable Diffusion על פי ההנחיה:"צילום של אסטרונאוט רוכב על סוס"
תמונה שנוצרה באמצעות Stable Diffusion על פי ההנחיה:"צילום של אסטרונאוט רוכב על סוס"
מחזור חיים 22 באוגוסט 2022 – הווה
גרסה אחרונה SDXL 1.0 (26 ביולי 2023) עריכת הנתון בוויקינתונים
נכתבה בשפות פייתון עריכת הנתון בוויקינתונים
סוג רישיון CreativeML Open RAIL-M עריכת הנתון בוויקינתונים
קוד מקור https://github.com/Stability-AI/generative-models עריכת הנתון בוויקינתונים
stability.ai/stable-image
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

Stable Diffusion הוא מודל למידה עמוקה שיוצר תמונה מטקסט. המודל פורסם בשנת 2022 והוא משמש בעיקר ליצירת תמונות מפורטות בהתאם לתיאורים טקסטואלים, אם כי ניתן להחיל אותו גם על משימות אחרות כגון שיפוץ תמונות ושחזור צבעים לתמונות שחור לבן.[1] המודל שוחרר על ידי שיתוף פעולה של מספר חברות: Stability AI, אוניברסיטת מינכן ו-Runway ובתמיכת EleutherAI ו-LAION.[2]

בניגוד לתוכנות יצירת תמונות מטקסט על בסיס בינה מלאכותית אחרות כגון DALL-E ו- Midjourney שהיו נגישים רק באמצעות שירותי ענן, הקוד של Stable Diffusion פורסם לציבור[3] והוא יכול לפעול על רוב המחשבים הביתיים בעלי GPU בסיסי.[4]

טכנולוגיית Stable Diffusion משמשת גם מודלים ג'נרטיביים (יצירתיים) נוספים דוגמת DreamShaper, RealisticVision. בשנת 2024 שחררה חברת Stability AI מודל נוסף המבוסס על אותה טכנולוגיה בשם Cascade.[5]

טכנולוגיה[עריכת קוד מקור | עריכה]

תרשים של ארכיטקטורת הדיפוזיה הסמויה בשימוש על ידי Stable Diffusion.
תהליך דה-noising המשמש את Stable Diffusion. המודל יוצר תמונות על ידי דהיית רעש אקראי באופן איטרטיבי עד שהגיע למספר מוגדר של שלבים, בהנחיית מקודד הטקסט CLIP שהוכשר מראש על מושגים יחד עם מנגנון הקשב, וכתוצאה מכך התמונה הרצויה מתארת ייצוג של המושג המאומן.

ארכיטקטורה[עריכת קוד מקור | עריכה]

יכולות[עריכת קוד מקור | עריכה]

מודל ה-Stable Diffusion תומך ביכולת ליצור תמונות חדשות מאפס באמצעות בקשת טקסט המתארת אלמנטים שיש לכלול או להשמיט מהתמונה הסופית.[6] באמצעות המודל ניתן לצייר מחדש תמונות קיימות ולשלב אלמנטים חדשים המתוארים על ידי הנחיית טקסט (תהליך המכונה "סינתזת תמונה מונחית").

שימוש[עריכת קוד מקור | עריכה]

יצירות הנוצרות ב-Stable Diffusion משוחררות מבחינת זכויות יוצרים והתוכנה מעניקה את זכויות השימוש בכל תמונה למשתמש שיצר את התיאור, בתנאי שתוכן התמונה אינו בלתי חוקי או מזיק לאחרים. החופשיות הניתנת למשתמשים על שימוש בתמונות יצר מחלוקות על האתיקה של זכויות יוצרים, מכיוון שבסופו של דבר, Stable Diffusion ומודלים יצירתיים אחרים מאומנים על תמונות רבות המוגנות בזכויות יוצרים ללא הסכמת הבעלים.[7]

לאור העובדה שסגנונות ויצירות ויזואליות אינן כפופות לזכויות יוצרים, נוטים לראות בתוצרים של Stable Diffusion ככאלו שאינן מפרות את זכויות היוצרים של יצירות דומות מבחינה ויזואלית.

עם זאת, אנשים המתוארים בתמונות שנוצרו עשויים להיות מוגנים על ידי זכויות אישיות אם נעשה שימוש בדמותם או בקניין רוחני אחר כגון לוגו מותג מוכר שאף הוא נשאר מוגן בזכויות יוצרים.

אף על פי כן, אמנים חזותיים רבים הביעו דאגה ששימוש בתוכנות דוגמת Stable Diffusion עלול להוביל בסופו של דבר לאמנים אנושיים, צלמים, דוגמנים ושחקנים, לאבד בהדרגה את הכדאיות המסחרית מול מתחרים מבוססי בינה מלאכותית.

רישיון שימוש[עריכת קוד מקור | עריכה]

בניגוד ל-DALL-E וMidJourney יוצרי Stable Diffusion פרסמו את קוד המקור מה שהפך את התוכנה לתוכנה חופשית וקוד פתוח,[8] הרישיון שלה אוסר על מקרי שימוש לא חוקיים בלבד כגון פשע, לשון הרע, הטרדה, דוקסינג, "ניצול קטינים", מתן ייעוץ רפואי, יצירת חובות משפטיות אוטומטית, הפקת ראיות משפטיות ו"אפליה או פגיעה ביחידים או קבוצות על סמך התנהגות חברתית או מאפיינים אישיים או אישיותיים". המשתמש הפרטי הוא הבעלים של הזכויות על תמונות הפלט שנוצרו, והוא חופשי להשתמש בהן באופן מסחרי.[9]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא Stable Diffusion בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ שחזור צבעי תמונות בשחור לבן באמצעות סטייבל דיפיוז'ן, באתר www.facebook.com
  2. ^ Revolutionizing image generation by AI: Turning text into images באתר אוניברסיטת מינכן (באנגלית)
  3. ^ Stable Diffusion, CompVis - Machine Vision and Learning LMU Munich, 2022-11-04, נבדק ב-2022-11-04
  4. ^ Mark Hachman, Creating AI art with Stable Diffusion will crush your PC, PCWorld, ‏5 ביולי 2022
  5. ^ K. C. Sabreena Basheer, Stability AI Introduces Stable Cascade: A New Era in Text-to-Image Generation, Analytics Vidhya, ‏2024-02-15 (באנגלית)
  6. ^ Stable Diffusion בGitHub
  7. ^ ויקי אוסלנדר, מחאת האמנים מתרחבת: "לא לתמונות שנוצרו באמצעות בינה מלאכותית", באתר כלכליסט, 14 בדצמבר 2022
  8. ^ יובל מן, Stable Diffusion: מחולל תמונות עם מינימום צנזורה, באתר ynet, 16 באוגוסט 2022
  9. ^ Steven Zeitchik, Ready or not, mass video deepfakes are coming, The Washington Post, ‏2 ביולי 2022