מחולל התמונות Stable Diffusion (סטייבל דיפיוז’ן) נמנה עם המחוללים הנפוצים ביותר, ומהבולטים שבהם. עד היום, למרות היצירתיות והתוצאות המרשימות שידע להפיק המחולל, התמונות הסופיות עדיין נראו ככאלו שנוצרו בבינה מלאכותית, והטאצ’ הריאליסטי היה חסר בהן בצורה ניכרת לעין. היום, חברת האם של המודל, Stability AI הכריזה על גרסת SDXL 0.9, גרסה מתקדמת ביותר עבור מחולל התמונות, המייצגת קפיצת מדרגה משמעותית ומרשימה ביכולות יצירת התמונות של המחולל הידוע, ומספקת תמונות ריאליסטיות, מפורטות ומשופרות יותר ביחס לגרסאות הקודמות.
מידג’רני אאוט, תמונות ריאליסטיות אין
המודל עודכן כעת להיות אחד המודלים הגדולים ביותר בקוד פתוח שפורסמו אי פעם ומיועדים ליצירת תמונות. השדרוג המשמעותי נובע בעיקר מהגדלת מספר הפרמטרים במודלים. בעוד שגרסת הבטא הסתמכה על מודל יחיד בגודל 3.1 מיליארד פרמטרים, גרסה 0.9 משתמשת בשני מודלים גדולים יותר במקביל כדי להוסיף פרטים ומרקם. השיפור בפרטים ובהרכב התמונה בולט במיוחד בהשוואה צד לצד של תמונות שנוצרו בעזרת גרסת הבטא והגרסאות הקודמות של המחולל. בדוגמאות שסיפקה החברה, ניתן לראות שהגרסה החדשה יוצרת תמונות ריאליסטיות ומפורטות בהרבה, עם מראה טבעי ומתוחכם יותר, שנותן מענה הולם סוף סוף למחולל מידג’רני, שהצטיין בכך עד כה כמחולל יחיד.
שיפורים נוספים לתכונות העריכה
הגרסה החדשה של סטייבל דיפיוז’ן קיבלה גם שיפור עבור תכונות העריכה מבוססות הטקסט – image-to-image המאפשרת להזין תמונה כקלט השראה עבור יצירת תמונות נוספות, inpainting – המאפשרת עריכה של אוביקטים ספציפיים בתוך התמונה, ו-outpainting – המאפשרת להרחיב תמונה לאזורים שנחתכו או לא קיימים בתמונה.
איך להשתמש בגרסה החדשה של Stable Diffusion כבר כעת?
גרסת ה-1.0 הסופית של המודל צפויה לצאת באופן חופשי באמצע חודש יולי. עד אז, גרסה 0.9 תהיה זמינה למטרות מחקר בלבד כדי לאסוף משוב לקראת הגרסה הסופית. אם אתם בכל זאת רוצים להתנסות במחולל החדש, שמציג תוצאות ריאליסטיות ומציאותיות, תשמחו לדעת שהוא זמין בשלב הזה בפלטפורמת ClipDrop של Stability AI לצד מגוון כלי בינה מלאכותית נוספים. במקביל, הוא הספיק לדלוף לרשת לפני השחרור הרשמי, וזמין כעת במחוללים כדוגמת Leonardo.ai.