OpenAI, מי שמוכרת לנו מ-ChatGPT ו-DALL-E, הציגה היום מודל חדש של טקסט לווידאו, והתוצאות פשוט מדהימות. המודל מאפשר ליצור וידאו מהנחיית טקסט פשוטה, והוא שונה מכל מה שהכרנו בתחום עד היום. אם עד היום בלטו מודלים כמו Runway ו-Pika שידעו להפוך תמונה סטטית לאנימציה דינמית קצרה מאוד, מגיע Sora ומשנה את כללי המשחק עם תוצאות שקשה לתאר מבלי לראות בעצמכם.
דמיינו שאתם יכולים לתאר כל דבר בכתב, וסורה יידע ליצור מזה ווידאו מושלם, עד אורך של דקה, כולל התמודדות טובה מאוד עם דמויות, תנועה במרחב, ואפילו עקביות בדמויות שמוצגות לאורך כל הסצנה. אם זה עדיין לא מרשים אתכם, פשוט תנו הצצה לסרטונים שלהלן.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
טקסט לוידאו איכותי: עידן חדש של יכולות וביצועים
Sora לא מסתפק רק ביצירת סצנות פשוטות. לפי OpenAI המודל יודע להתמודד עם סצנות מורכבות וריבוי דמויות, כולל יכולת להציג דמויות עם רגשות ספציפיים, כאשר התוצר הסופי ריאליסטי ועקבי במיוחד. בנוסף ליכולת להפוך טקסט לווידאו, סורה יודע להפוך תמונה לווידאו, לבצע Inpainting בסרטון קיים, ואפילו להאריך אותו.
עם ההכרזה על מודל הוידאו החדש, עלו חששות וטענות של מומחים שונים לגבי היכולות האמיתיות של סורה. חלקם טענו שהחברה בחרה בקפידה מספר סרטונים מוצלחים של המודל, ורק אותם הציגה לציבור. כדי להפיג מעט את החששות, סאם אלטמן, מנכ”ל OpenAI, הציע למשתמשים לכתוב לו פרומפטים, והוא בתגובה החזיר סרטונים שיצרה סורה בהתאם לפרומפטים. התוצאות בהחלט מרשימות.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
התרגשות מוקדמת מידי?
היכולות המרשימות של מחולל הוידאו Sora הביאו אנשים רבים להתרגש יתר על המידה ולהכריז על שינוי עולם הקולנוע והוידאו כפי שאנחנו מכירים אותו. בפועל, המחדל עדיין נמצא בפיתוח, ונגיש רק למספר מאוד מצומצם של אנשים נכון לעת כתיבת שורות אלו. השחרור לציבור הרחב לא יגיע בעתיד הקרוב, כנראה.
בעתיד, בעולם שבו השילוב של בינה מלאכותית ווידאו יהיה נגיש לכולם, אכן אין ספק ש-Sora עשוי להיות הכלי החזק שישפיע על עולם הווידאו והקולנוע. דמיינו שלכל אחד יש האופציה להפוך כל רעיון לסרטון וידאו איכותי בקלות, בלי ציוד יקר או ידע טכני, ובמהירות.