«کدام نابغه خلاق‌تر است: هوش مصنوعی نانو بنانا یا میدجرنی؟ (شوکه‌کننده‌ترین رقابت قرن!)»

گوشی موبایل اپل مدل iPhone 16 Pro Max ZAA دو سیم کارت ظرفیت 256 گیگابایت و رم 8 گیگابایت

فهرست محتوا

نبرد خلاقیت: آیا هوش مصنوعی نانو بنانا گوی سبقت را از میدجرنی می‌رباید؟

در عصر کنونی، هوش‌های مصنوعی متعددی در زمینه تولید تصویر قد علم کرده‌اند. در این میان، میدجرنی (Midjourney) مدتهاست که به عنوان یک استاندارد طلایی در خلاقیت، واقع‌گرایی و انعطاف‌پذیری شناخته می‌شود. با این حال، مدل جدید گوگل با نام نانو بنانا (Nano Banana) به‌سرعت در حال مطرح شدن است. سرعت بالا، سهولت در استفاده و توانایی در خلق تصاویر جذاب و دوست‌داشتنی در شبکه‌های اجتماعی، باعث شده تا توجهات زیادی به این مدل جدید جلب شود. درواقع اپلیکیشن جمینای (Gemini) که میزبان این مدل است، اکنون بیش از ۲۹ میلیون کاربر فعال دارد و محبوبیت این موضوع را به خوبی نشان می‌دهد.

اما برای بررسی دقیق‌تر این دو هوش مصنوعی ساخت عکس، هر دو مدل با ۵ درخواست یکسان آزمایش شده‌اند. در ادامه به بررسی نتایج این رقابت می‌پردازیم:

۱- واقع‌گرایی

یک پرتره هایپررئالیستی از یک زن سالخورده با چین‌وچروک‌های عمیق، موهای نقره‌ای جمع‌شده، شالی کرم‌رنگ، در نور نرم و طلایی، با بافت پوست فوق‌العاده دقیق.

نانو بنانا: تنها یک تصویر تولید کرد، اما در همان تصویر موفق شد تمام جزئیات درخواست‌شده را به طور کامل پیاده‌سازی کند. نورپردازی طلایی، جزئیات پرامپت و نورپردازی گرم را به خوبی به تصویر کشیده است. نتیجه آن یک تصویر فوتورئالیستی چشمگیر و بسیار واقعی بود.

میدجرنی: چندین تصویر ایجاد کرد، اما هیچکدام نتوانستند عنصر «نور طلایی ایتالیایی» را به‌درستی نمایش دهند. اگرچه تصاویر از نظر ظاهری واقعی بودند، اما دقت و هماهنگی آن‌ها با پرامپت به پای نانو بنانا نرسید.

برنده: نانو بنانا به دلیل ثبت کامل همه جزئیات پرامپت و ارائه یک تصویر فوتورئالیستی برتر.

۲- ساخت دنیای فانتزی

یک قلعه شناور از جنس شیشه و کریستال که بالای آبشاری معلق است، اژدهاهایی اطراف آن پرواز می‌کنند و روستاییان از پایین به تماشا ایستاده‌اند.

نانو بنانا: تصویری شگفت‌انگیز و فانتزی خلق کرد؛ قلعه‌ای نورانی همراه با آبشار درخشان که گویی از دل یک کتاب داستان بیرون آمده است. با این حال، ابرهای بیش از حد منظم و پرندگان کاملاً هم‌فاصله، صحنه را کمی مصنوعی جلوه دادند و از حس جادویی آن کاستند.

میدجرنی: چهار تصویر خیره‌کننده ارائه داد که نشان می‌داد نه تنها تمام اجزای پرامپت را پوشش داده، بلکه با افزودن جزئیات اضافه، صحنه‌هایی فراتر از انتظار را رقم زده است. با افزودن جزئیات اضافه، صحنه‌هایی فراتر از انتظار را رقم زد.

برنده: میدجرنی به دلیل خلق صحنه‌های واقعی فانتزی که هم با پرامپت هماهنگ بود و هم عناصر اضافی آن را به سطحی بالاتر رساند.

۳- آزمون واقع‌گرایی روزمره

یک کافه شلوغ در شهر نیویورک در یک روز بارانی؛ میزها روی کف زمین، مشتریانی مشغول کار با لپ‌تاپ و باریستایی که شیر را می‌جوشاند دیده می‌شوند.

نانو بنانا: توانست روز بارانی را نشان دهد، اما این کار را با قرار دادن چندین چتر در ارتفاع بالا انجام داد که غیرواقعی به‌نظر می‌رسید (چترها معمولاً نزدیک در ورودی و در ارتفاع پایین‌تر قرار دارند). علاوه‌ بر این، نوع مشتریان کافه کم بود و اغلب آن‌ها شبیه هم به‌نظر می‌رسیدند.

میدجرنی: به نوع نیویورکی توجه کرد و گروهی متنوع از افراد را در کافه به تصویر کشید. زاویه دید انتخابی کمی متفاوت از انتظار بود، اما به‌خوبی حس شلوغی کافه را منتقل کرد. بارانی بودن به‌طور مستقیم دیده نمی‌شد، اما با توجه به لباس مشتریان، شرایط آب‌وهوایی بارانی به‌خوبی قابل درک بود.

برنده: میدجرنی به دلیل ارائه تصویری واقع‌گرایانه‌تر از یک کافه نیویورکی، حتی با وجود نمایش کمتر از بارش باران.

۴- طنز و سورئالیسم

یک سگ نژاد کورگی سامورایی که بر روی اسکیت‌برد در جنگل بامبو حرکت می‌کند، طراحی‌شده در سبک چاپ چوبی اوکی‌یو-ای (ukiyo-e).

نانو بنانا: تصویری خلاقانه خلق کرد که هم کورگی سامورایی و هم صحنه را به‌خوبی نشان می‌داد و عنصر سبک چاپ چوبی اوکی‌یو-ای را بهتر از رقیب به تصویر کشید.

میدجرنی: تصاویر بامزه و متنوعی از کورگی‌های سامورایی تولید کرد. سگ‌ها در حالت‌ها و ژست‌های مختلف به نمایش در آمدند، اما نتوانست نوستالژی موجود در تصاویر را ناخوآگاه بیرون بکشد و همین موضوع از کیفیت کلی آن کاست.

برنده: نانو بنانا به دلیل نمایش دقیق‌تر سبک سنتی چاپ چوبی اوکی‌یو-ای و حفظ هماهنگی کامل با پرامپت.

۵- چالش رندر متن

تابلوی نئونی یک کافه شبانه که روی آن نوشته شده «OPEN 24 HOURS» همراه با میزهای درخشان روی آسفالت خیس، با پس‌زمینه‌ای از یک کافه سبک دهه ۱۹۵۰.

نانو بنانا: نمای بیرونی یک کافه دهه پنجاه میلادی را به‌صورت فوتورئالیستی خلق کرد و توانست متن روی تابلو را بدون غلط املایی نمایش دهد. با این حال، میزهای روی زمین بیش از حد مصنوعی به‌نظر می‌رسید و بخشی از حس طبیعی بودن صحنه را از بین برد.

میدجرنی: نه‌تنها نمای بیرونی کافه دهه ۱۹۵۰ را دقیق‌تر بازسازی کرد، بلکه طراحی داخلی آن را هم در نظر گرفت. هرچند در یکی از تصاویر واژه “hours” اشتباه نوشته شده بود، اما سه تصویر دیگر به‌مراتب واقع‌گرایانه‌تر و قابل‌باورتر از خروجی نانو بنانا بودند.

برنده: میدجرنی به دلیل ارائه تصویری کامل‌تر و باورپذیرتر از خروجی نانو بنانا بود.

برنده نهایی: نانو بنانا

پس از بررسی ۵ دور رقابت، یک نکته روشن است: نانو بنانا فراتر از انتظار ظاهر شد. این مدل در زمینه‌های فوتورئالیسم، طنز و پرامپت‌های هنری عملکردی درخشان از خود نشان داد. در مقابل، میدجرنی ارزش خود را در ساخت دنیاهای فانتزی و واقع‌گرایی روزمره نشان داد و با تولید چندین نسخه متنوع، حتی با وجود ایرادهای کوچک، اغلب تجربه‌ای بهتر و گسترده‌تر ارائه کرد.

در این رقابت، نانو بنانا برنده شد؛ چراکه توانست سریع‌تر، دقیق‌تر و با ظرافتی غیرمنتظره به پرامپت‌ها پاسخ دهد و به بهترین گزینه برای تولید سریع تصاویر با توجه به دستور تبدیل شود. با این حال، اگر به دنبال مجموعه‌ای متنوع‌تر با جزئیات لایه‌لایه و انتخاب‌های بیشتر باشید، میدجرنی همچنان برتری خود را حفظ می‌کند.

این رقابت بیشتر شبیه به یک برد نزدیک و نسبی بود تا یک پیروزی قاطع و یادآور این واقعیت است که هنر هوش مصنوعی با سرعتی سرسام‌آور در حال تکامل است و به‌زودی شاهد ظهور مدل‌های نوظهور بیشتری خواهیم بود.

منبع: tomsguide

سوالات متداول

  • نانو بنانا چیست؟

    مدل جدید گوگل برای تولید تصویر با هوش مصنوعی که در اپلیکیشن Gemini عرضه شده است.

  • چه چیزی نانو بنانا را متمایز می‌کند؟

    سرعت بالا، سهولت استفاده و توانایی خلق تصاویر وایرال و وفادار به پرامپت.

  • میدجرنی در چه حوزه‌هایی قوی‌تر است؟

    ساخت دنیای فانتزی و واقع‌گرایی روزمره با جزئیات بیشتر و تنوع بالاتر.

  • آیا میدجرنی تصاویر بهتری تولید می‌کند؟

    بله، میدجرنی معمولا چند خروجی متنوع ارائه می‌دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *