در دنیای امروز، محتوای ویدئویی نقش بسزایی در ارتباطات، آموزش و سرگرمی ایفا میکند. با پیشرفت روزافزون هوش مصنوعی، امکان تولید ویدئوهای با کیفیت و جذاب، با سرعت و سهولت بیشتری فراهم شده است. آمازون، به عنوان یکی از پیشگامان عرصه فناوری، با معرفی مدل هوش مصنوعی Nova Reel 1.1، گامی بلند در این زمینه برداشته است. این مدل، قادر است ویدئوهای ۲ دقیقهای را با استفاده از دستورات متنی و تصاویر، تولید کند. این دستاورد، میتواند تحولی عظیم در نحوه تولید محتوای ویدئویی ایجاد کند و امکانات جدیدی را برای کاربران فراهم سازد. در این گزارش، به بررسی جزئیات این فناوری و کاربردهای آن میپردازیم.
آمازون قدرت خلق ویدیو را دوچندان کرد؛ هوش مصنوعی “نوا ریل” تا دو دقیقه فیلم میسازد!
“نوا ریل” (Nova Reel)، نخستین گام جدی شرکت “آمازون” (Amazon) به دنیای پرهیاهوی هوش مصنوعی مولد ویدیو بود که در دسامبر سال ۲۰۲۴ معرفی شد. این محصول در بازاری که به سرعت در حال رقابتیتر شدن است، مستقیماً با مدلهای هوش مصنوعی شرکتهای بزرگی همچون “اوپنایآی” (OpenAI) و “گوگل” وارد عرصه رقابت میشود.
“الیزابت فوئنتس” (Elizabeth Fuentes)، توسعهدهنده خدمات وب آمازون، در یک پست وبلاگی به تشریح قابلیتهای جدیدترین مدل نوا ریل با نام “نوا ریل ۱.۱” پرداخت. بر اساس توضیحات وی، این مدل پیشرفته اکنون قادر است ویدیوهای چند سکانسی را با حفظ یک سبک بصری ثابت تولید کند. کاربران میتوانند با ارائه یک درخواست متنی تا سقف ۴۰۰۰ کاراکتر، یک ویدیوی کامل به مدت دو دقیقه متشکل از سکانسهای ۶ ثانیهای خلق کنند.
نوا ریل ۱.۱ همچنین یک حالت جدید با عنوان “Multishot Manual” را معرفی کرده است. در این حالت، مدل میتواند یک تصویر ورودی را به همراه یک درخواست متنی دریافت کرده و بدین ترتیب، کنترل بیشتری را بر ترکیببندی نهایی ویدیوی تولید شده در اختیار کاربر قرار دهد. با دریافت یک تصویر با وضوح ۱۲۸۰ در ۷۲۰ پیکسل و یک درخواست متنی حداکثر ۵۱۲ کاراکتری، حالت “Multishot Manual” قادر به تولید ویدیوهایی با حداکثر ۲۰ تصویر خواهد بود.
دسترسی به نوا ریل در حال حاضر تنها از طریق پلتفرمها و خدمات وب آمازون، از جمله “Bedrock” – مجموعه ابزارهای توسعهدهندگان هوش مصنوعی آمازون – امکانپذیر است و مشتریان برای استفاده از آن نیازمند درخواست دسترسی هستند. همانند بسیاری از سیستمهای هوش مصنوعی مولد، سوالاتی پیرامون اخلاقی بودن روشهای توسعه و آموزش نوا ریل مطرح شده است.
مدلهای تولید ویدیو برای یادگیری الگوهای موجود در ویدیوها و تولید محتوای جدید، بر روی حجم عظیمی از نمونههای ویدیویی آموزش داده میشوند. برخی از شرکتها بدون کسب اجازه از صاحبان یا سازندگان، مدلهای خود را بر روی ویدیوهای دارای حق نسخهبرداری آموزش میدهند. این امر میتواند منجر به این شود که وقتی این مدلها تصاویر دارای حق نسخهبرداری را تولید میکنند، کاربران آنها در معرض شکایتهای مربوط به نقض مالکیت معنوی قرار بگیرند.
آمازون هنوز منبع دادههای آموزشی نوا ریل را به طور عمومی اعلام نکرده و روش شفافی را برای سازندگانی که احتمالاً مجموعه دادههای مدلها را با ویدیوهای خود تغذیه میکنند، ارائه نداده است. با وجود این، آمازون اعلام کرده است که از هر مشتری که به دلیل نقض حق نسخهبرداری محتوای تولید شده توسط مدلها متهم شود، مطابق با خط مشی غرامت خود محافظت خواهد کرد.