نبرد خلاقیت: آیا هوش مصنوعی نانو بنانا گوی سبقت را از میدجرنی میرباید؟
در عصر کنونی، هوشهای مصنوعی متعددی در زمینه تولید تصویر قد علم کردهاند. در این میان، میدجرنی (Midjourney) مدتهاست که به عنوان یک استاندارد طلایی در خلاقیت، واقعگرایی و انعطافپذیری شناخته میشود. با این حال، مدل جدید گوگل با نام نانو بنانا (Nano Banana) بهسرعت در حال مطرح شدن است. سرعت بالا، سهولت در استفاده و توانایی در خلق تصاویر جذاب و دوستداشتنی در شبکههای اجتماعی، باعث شده تا توجهات زیادی به این مدل جدید جلب شود. درواقع اپلیکیشن جمینای (Gemini) که میزبان این مدل است، اکنون بیش از ۲۹ میلیون کاربر فعال دارد و محبوبیت این موضوع را به خوبی نشان میدهد.
اما برای بررسی دقیقتر این دو هوش مصنوعی ساخت عکس، هر دو مدل با ۵ درخواست یکسان آزمایش شدهاند. در ادامه به بررسی نتایج این رقابت میپردازیم:
۱- واقعگرایی
یک پرتره هایپررئالیستی از یک زن سالخورده با چینوچروکهای عمیق، موهای نقرهای جمعشده، شالی کرمرنگ، در نور نرم و طلایی، با بافت پوست فوقالعاده دقیق.
نانو بنانا: تنها یک تصویر تولید کرد، اما در همان تصویر موفق شد تمام جزئیات درخواستشده را به طور کامل پیادهسازی کند. نورپردازی طلایی، جزئیات پرامپت و نورپردازی گرم را به خوبی به تصویر کشیده است. نتیجه آن یک تصویر فوتورئالیستی چشمگیر و بسیار واقعی بود.
میدجرنی: چندین تصویر ایجاد کرد، اما هیچکدام نتوانستند عنصر «نور طلایی ایتالیایی» را بهدرستی نمایش دهند. اگرچه تصاویر از نظر ظاهری واقعی بودند، اما دقت و هماهنگی آنها با پرامپت به پای نانو بنانا نرسید.
برنده: نانو بنانا به دلیل ثبت کامل همه جزئیات پرامپت و ارائه یک تصویر فوتورئالیستی برتر.
۲- ساخت دنیای فانتزی
یک قلعه شناور از جنس شیشه و کریستال که بالای آبشاری معلق است، اژدهاهایی اطراف آن پرواز میکنند و روستاییان از پایین به تماشا ایستادهاند.
نانو بنانا: تصویری شگفتانگیز و فانتزی خلق کرد؛ قلعهای نورانی همراه با آبشار درخشان که گویی از دل یک کتاب داستان بیرون آمده است. با این حال، ابرهای بیش از حد منظم و پرندگان کاملاً همفاصله، صحنه را کمی مصنوعی جلوه دادند و از حس جادویی آن کاستند.
میدجرنی: چهار تصویر خیرهکننده ارائه داد که نشان میداد نه تنها تمام اجزای پرامپت را پوشش داده، بلکه با افزودن جزئیات اضافه، صحنههایی فراتر از انتظار را رقم زده است. با افزودن جزئیات اضافه، صحنههایی فراتر از انتظار را رقم زد.
برنده: میدجرنی به دلیل خلق صحنههای واقعی فانتزی که هم با پرامپت هماهنگ بود و هم عناصر اضافی آن را به سطحی بالاتر رساند.
۳- آزمون واقعگرایی روزمره
یک کافه شلوغ در شهر نیویورک در یک روز بارانی؛ میزها روی کف زمین، مشتریانی مشغول کار با لپتاپ و باریستایی که شیر را میجوشاند دیده میشوند.
نانو بنانا: توانست روز بارانی را نشان دهد، اما این کار را با قرار دادن چندین چتر در ارتفاع بالا انجام داد که غیرواقعی بهنظر میرسید (چترها معمولاً نزدیک در ورودی و در ارتفاع پایینتر قرار دارند). علاوه بر این، نوع مشتریان کافه کم بود و اغلب آنها شبیه هم بهنظر میرسیدند.
میدجرنی: به نوع نیویورکی توجه کرد و گروهی متنوع از افراد را در کافه به تصویر کشید. زاویه دید انتخابی کمی متفاوت از انتظار بود، اما بهخوبی حس شلوغی کافه را منتقل کرد. بارانی بودن بهطور مستقیم دیده نمیشد، اما با توجه به لباس مشتریان، شرایط آبوهوایی بارانی بهخوبی قابل درک بود.
برنده: میدجرنی به دلیل ارائه تصویری واقعگرایانهتر از یک کافه نیویورکی، حتی با وجود نمایش کمتر از بارش باران.
۴- طنز و سورئالیسم
یک سگ نژاد کورگی سامورایی که بر روی اسکیتبرد در جنگل بامبو حرکت میکند، طراحیشده در سبک چاپ چوبی اوکییو-ای (ukiyo-e).
نانو بنانا: تصویری خلاقانه خلق کرد که هم کورگی سامورایی و هم صحنه را بهخوبی نشان میداد و عنصر سبک چاپ چوبی اوکییو-ای را بهتر از رقیب به تصویر کشید.
میدجرنی: تصاویر بامزه و متنوعی از کورگیهای سامورایی تولید کرد. سگها در حالتها و ژستهای مختلف به نمایش در آمدند، اما نتوانست نوستالژی موجود در تصاویر را ناخوآگاه بیرون بکشد و همین موضوع از کیفیت کلی آن کاست.
برنده: نانو بنانا به دلیل نمایش دقیقتر سبک سنتی چاپ چوبی اوکییو-ای و حفظ هماهنگی کامل با پرامپت.
۵- چالش رندر متن
تابلوی نئونی یک کافه شبانه که روی آن نوشته شده «OPEN 24 HOURS» همراه با میزهای درخشان روی آسفالت خیس، با پسزمینهای از یک کافه سبک دهه ۱۹۵۰.
نانو بنانا: نمای بیرونی یک کافه دهه پنجاه میلادی را بهصورت فوتورئالیستی خلق کرد و توانست متن روی تابلو را بدون غلط املایی نمایش دهد. با این حال، میزهای روی زمین بیش از حد مصنوعی بهنظر میرسید و بخشی از حس طبیعی بودن صحنه را از بین برد.
میدجرنی: نهتنها نمای بیرونی کافه دهه ۱۹۵۰ را دقیقتر بازسازی کرد، بلکه طراحی داخلی آن را هم در نظر گرفت. هرچند در یکی از تصاویر واژه “hours” اشتباه نوشته شده بود، اما سه تصویر دیگر بهمراتب واقعگرایانهتر و قابلباورتر از خروجی نانو بنانا بودند.
برنده: میدجرنی به دلیل ارائه تصویری کاملتر و باورپذیرتر از خروجی نانو بنانا بود.
برنده نهایی: نانو بنانا
پس از بررسی ۵ دور رقابت، یک نکته روشن است: نانو بنانا فراتر از انتظار ظاهر شد. این مدل در زمینههای فوتورئالیسم، طنز و پرامپتهای هنری عملکردی درخشان از خود نشان داد. در مقابل، میدجرنی ارزش خود را در ساخت دنیاهای فانتزی و واقعگرایی روزمره نشان داد و با تولید چندین نسخه متنوع، حتی با وجود ایرادهای کوچک، اغلب تجربهای بهتر و گستردهتر ارائه کرد.
در این رقابت، نانو بنانا برنده شد؛ چراکه توانست سریعتر، دقیقتر و با ظرافتی غیرمنتظره به پرامپتها پاسخ دهد و به بهترین گزینه برای تولید سریع تصاویر با توجه به دستور تبدیل شود. با این حال، اگر به دنبال مجموعهای متنوعتر با جزئیات لایهلایه و انتخابهای بیشتر باشید، میدجرنی همچنان برتری خود را حفظ میکند.
این رقابت بیشتر شبیه به یک برد نزدیک و نسبی بود تا یک پیروزی قاطع و یادآور این واقعیت است که هنر هوش مصنوعی با سرعتی سرسامآور در حال تکامل است و بهزودی شاهد ظهور مدلهای نوظهور بیشتری خواهیم بود.
منبع: tomsguide
سوالات متداول
نانو بنانا چیست؟
مدل جدید گوگل برای تولید تصویر با هوش مصنوعی که در اپلیکیشن Gemini عرضه شده است.
چه چیزی نانو بنانا را متمایز میکند؟
سرعت بالا، سهولت استفاده و توانایی خلق تصاویر وایرال و وفادار به پرامپت.
میدجرنی در چه حوزههایی قویتر است؟
ساخت دنیای فانتزی و واقعگرایی روزمره با جزئیات بیشتر و تنوع بالاتر.
آیا میدجرنی تصاویر بهتری تولید میکند؟
بله، میدجرنی معمولا چند خروجی متنوع ارائه میدهد.







