Midjourney V7 آمد! رقابت نفس‌ گیر با GPT-4o در تولید تصویر

چکیده

رقابت نفس‌ گیر Midjourney V7 با GPT-4o! مدل جدید میدجرنی از راه رسید. مدل جدید هوش مصنوعی تصویرساز میدجرنی با کیفیت بهتر و درک پرامپت قوی در رقابت با GPT-4o. بررسی کامل در های ورت.

۱۴۰۴ شنبه ۱۷ فروردين
37 بازديد
بررسی قابلیت درک پرامپت پیچیده توسط مدل هوش مصنوعی میدجرنی V7 | های ورت

دنیای هوش مصنوعی (AI) تصویرساز، میدانی برای رقابتی نفس‌گیر و پیشرفت‌های برق‌آساست! 🔥 پس از مدتی سکوت نسبی، Midjourney، یکی از پیشگامان و محبوب‌ترین ابزارهای تولید تصویر با هوش مصنوعی، با دستی پر بازگشته و از نسخه جدید و متحول‌شده‌ی خود، V7، رونمایی کرده است. این اتفاق درست پس از آن رخ می‌دهد که قابلیت‌های جدید تصویرسازی در ChatGPT (مبتنی بر GPT-4o) با ترند وایرال سبک استودیو جیبلی، توجه‌ها را به خود جلب کرده بود. 🎨

Midjourney ادعا می‌کند که V7 "هوشمندترین، زیباترین و منسجم‌ترین" مدل این شرکت تا به امروز است و با بهبودهای چشمگیر در درک پرامپت‌های متنی و کیفیت خروجی، به‌خصوص در نمایش جزئیاتی مانند دست‌ها، قصد دارد بار دیگر استانداردها را در این حوزه جابجا کند. 🤯 آیا Midjourney V7 می‌تواند به این وعده‌ها عمل کند و جایگاه خود را در رقابت با غول‌های جدیدی مانند GPT-4o و مدل‌های گوگل مستحکم‌تر نماید؟

 

در این مقاله‌ی جامع از های ورت (hiwert.com)، به طور کامل به بررسی Midjourney V7 می‌پردازیم. از قابلیت‌های جدید و بهبودیافته‌ی آن گرفته تا نحوه‌ی دسترسی، مقایسه با نسل‌های قبلی و جایگاه آن در چشم‌انداز رقابتی هوش مصنوعی تصویرساز. با ما همراه باشید تا با آخرین دستاورد یکی از بازیگران اصلی این عرصه‌ی هیجان‌انگیز بیشتر آشنا شوید! ✨

 

 

 Midjourney چیست؟ (یادآوری کوتاه بر یکی از محبوب‌ترین‌های AI تصویرساز)

 

پیش از پرداختن به V7، بد نیست یادآوری کنیم که Midjourney چیست. میدجرنی یک آزمایشگاه تحقیقاتی مستقل و همچنین نام سرویس هوش مصنوعی تولید تصویر آن‌هاست که به سرعت به یکی از شناخته‌شده‌ترین و تحسین‌شده‌ترین ابزارها در این حوزه تبدیل شد. این ابزار که عمدتاً از طریق پلتفرم دیسکورد (Discord) در دسترس کاربران قرار می‌گیرد، به خاطر توانایی‌اش در خلق تصاویر هنری، فانتزی و با سبک‌های منحصربه‌فرد شهرت دارد. کاربران با وارد کردن توصیفات متنی (پرامپت)، می‌توانند از Midjourney بخواهند تا تصاویری خلاقانه و خیره‌کننده برایشان ایجاد کند.

 

 

رونمایی از V7 Alpha: "هوشمندترین، زیباترین و منسجم‌ترین" مدل میدجرنی!

 

پس از ماه‌ها انتظار و در حالی که رقبا مدل‌های جدید خود را معرفی می‌کردند، Midjourney سرانجام از نسخه آلفای مدل V7 خود رونمایی کرد. دیوید هولز (David Holz)، مدیرعامل Midjourney، در اطلاعیه‌ای در دیسکورد و همچنین در حساب رسمی X این شرکت، V7 را به عنوان یک مدل "کاملاً جدید" و "هوشمندترین، زیباترین و منسجم‌ترین مدل" این شرکت تا به امروز توصیف کرد.

 

اعلام شده که این نسخه هنوز در مرحله‌ی آزمایشی آلفا قرار دارد و تیم Midjourney انتظار دارد که طی دو ماه آینده، هر یک تا دو هفته، به‌روزرسانی‌های جدیدی برای آن منتشر کند. این بدان معناست که قابلیت‌ها و عملکرد V7 همچنان در حال بهبود و تکامل است و ممکن است در ابتدا با برخی مشکلات یا تغییرات مواجه باشد.

 

 

چه چیزهایی در Midjourney V7 بهبود یافته است؟ (کیفیت، درک پرامپت، دست‌ها!)

بر اساس اعلام Midjourney و بازخوردهای اولیه کاربران، V7 نسبت به نسخه‌های قبلی، به‌خصوص V6، پیشرفت‌های قابل توجهی داشته است:

 

  • درک بهتر پرامپت‌های متنی: یکی از اهداف اصلی V7، بهبود درک مدل از دستورات متنی پیچیده و ظرافت‌های زبانی بوده است. این بدان معناست که V7 باید بتواند ایده‌ها و توصیفات کاربران را با دقت بیشتری به تصویر تبدیل کند و نتایج مرتبط‌تری ارائه دهد.

 

  • کیفیت تصویر بالاتر: کیفیت کلی تصاویر خروجی، از جمله بافت‌ها (Textures)، جزئیات و واقع‌گرایی، به طور محسوسی افزایش یافته است.

 

  • حل مشکل دست‌ها! (و بدن): یکی از بزرگترین چالش‌های تمام مدل‌های هوش مصنوعی تصویرساز، تولید دست‌ها و آناتومی بدن انسان به شکلی دقیق و طبیعی بوده است. تصاویر تولید شده توسط مدل‌های قبلی اغلب دارای دست‌هایی با تعداد انگشتان اشتباه یا حالت‌های غیرطبیعی بودند. Midjourney ادعا می‌کند که V7 در این زمینه پیشرفت چشمگیری داشته و می‌تواند دست‌ها و بدن‌ها را با کیفیت بسیار بهتری تولید کند. برخی تصاویر منتشر شده توسط کاربران اولیه، حتی دست‌هایی با ظاهر فوتورئالیستی را نشان می‌دهند که اگر این توانایی پایدار باشد، یک جهش بزرگ محسوب می‌شود.

 

 

قابلیت‌های جدید و هیجان‌انگیز V7:

علاوه بر بهبودهای کلی، V7 دو قابلیت کاملاً جدید و کاربردی را معرفی کرده است:

 

  • حالت پیش‌نویس (Draft Mode): سرعت ۱۰ برابر، هزینه نصف! 🚀💰 شاید جذاب‌ترین ویژگی جدید، "حالت پیش‌نویس" باشد. این حالت به کاربران اجازه می‌دهد تا با سرعتی ۱۰ برابر حالت استاندارد و با نصف هزینه (از نظر مصرف منابع یا کردیت کاربر)، پیش‌نمایش‌های سریع و اولیه‌ای از ایده‌های خود تولید کنند.

 

 

کیفیت خروجی: تصاویر تولید شده در Draft Mode طبیعتاً کیفیت پایین‌تر و جزئیات کمتری دارند و حالت "خام"تری دارند.

 

کاربرد: این حالت برای آزمایش سریع ایده‌های مختلف، تکرار (Iteration)، طوفان فکری و همکاری بسیار ایده‌آل است. Midjourney حتی اشاره کرده که این حالت با ورودی صوتی نیز کار می‌کند و کاربران می‌توانند به صورت شفاهی ایده‌های خود را بیان کنند و پیش‌نویس‌ها را ببینند ("بگذارید ایده‌ها مانند رویاهای مایع جریان یابند").

 

ارتقاء کیفیت: اگر از نتیجه‌ی یک تصویر در حالت پیش‌نویس راضی بودید، می‌توانید با کلیک روی گزینه‌های "Enhance" (بهبود) یا "Vary" (تنوع بخشی)، آن تصویر خاص را با کیفیت کامل مدل V7 دوباره رندر کنید.

 

 

 

 

  • شخصی‌سازی (Personalization): آموزش AI بر اساس سلیقه شما! (فعال به صورت پیش‌فرض) اگرچه قابلیت شخصی‌سازی در نسخه‌های قبلی Midjourney نیز وجود داشت، اما در V7 Alpha به صورت پیش‌ فرض فعال شده و برای دسترسی به مدل، انجام آن الزامی است.

 

مفهوم: شخصی‌سازی به Midjourney کمک می‌کند تا سلیقه و ترجیحات بصری شما را یاد بگیرد و تصاویری تولید کند که بیشتر به سبک مورد علاقه‌ی شما نزدیک باشند. Midjourney آن را "دستیار سبک برای خلق تصاویر شما" توصیف می‌کند.

نحوه فعال‌سازی: برای ایجاد "پروفایل شخصی‌سازی جهانی V7" (V7 Global Personalization Profile) و باز کردن قفل دسترسی به V7 Alpha، کاربران باید ابتدا حداقل ۲۰۰ جفت تصویر را در پلتفرم Midjourney رتبه‌بندی (Rate) کنند (انتخاب تصویر بهتر از بین دو گزینه).

قابلیت غیرفعال‌سازی: اگرچه شخصی‌سازی به صورت پیش‌فرض فعال است، اما کاربران می‌توانند در صورت تمایل، بعداً آن را غیرفعال کنند تا نتایج عمومی‌تری دریافت نمایند.

 

 

 

حالت‌های رندرینگ و قابلیت‌های در دست توسعه V7

علاوه بر Draft Mode، برای رندرینگ با کیفیت استاندارد در V7 Alpha، دو حالت دیگر نیز در دسترس است:

 

  • Turbo Mode: سریع‌ترین حالت رندرینگ با کیفیت کامل، اما پرهزینه‌تر است (طبق گزارش‌ها، هزینه آن دو برابر حالت استاندارد V6 است).
  • Relax Mode: حالت کندتر، اما مقرون‌به‌صرفه‌تر.

 

Midjourney اعلام کرده که حالت سرعت استاندارد (Standard Speed Mode) برای V7 هنوز در حال بهینه‌سازی است و در آینده به گزینه‌ها اضافه خواهد شد.

 

همچنین، برخی قابلیت‌های مهم مانند بزرگنمایی با کیفیت بالا (Upscaling)، ویرایش تصویر (Editing) و بافت‌دهی مجدد (Retexturing) در حال حاضر در V7 Alpha موجود نیستند و برای استفاده از این امکانات، کاربران فعلاً به مدل V6 بازگردانده می‌شوند. Midjourney قول داده است که نسخه‌های V7 این قابلیت‌ها را طی "چند ماه آینده" منتشر کند.

 

 

چگونه به Midjourney V7 Alpha دسترسی پیدا کنیم؟ (راهنمای قدم به قدم)

اگر می‌خواهید جدیدترین مدل Midjourney را امتحان کنید، مراحل زیر را دنبال نمایید:

 

عضویت در Midjourney: اگر هنوز عضو نیستید، باید ابتدا از طریق وب‌سایت رسمی Midjourney، یکی از پلن‌های اشتراک پولی آن را تهیه کنید. (Midjourney سرویس رایگان ندارد).

 

دسترسی به پلتفرم: وارد حساب کاربری خود در وب‌سایت Midjourney یا سرور دیسکورد آن شوید.

 

فعال‌سازی شخصی‌سازی: به بخش رتبه‌بندی تصاویر (Image Rating) بروید و شروع به امتیازدهی به جفت تصاویر کنید. شما باید حداقل ۲۰۰ جفت را رتبه‌بندی کنید تا پروفایل شخصی‌سازی V7 شما ایجاد شود.

 

فعال کردن V7 Alpha: پس از تکمیل مرحله‌ی شخصی‌سازی، می‌توانید در تنظیمات Midjourney یا با استفاده از پارامتر --v 7 در انتهای پرامپت‌های خود، مدل V7 Alpha را فعال کنید.

 

 

 

پرسش‌ های متداول

 

  • آیا استفاده از Midjourney V7 رایگان است؟ خیر. Midjourney یک سرویس اشتراکی پولی است و برای استفاده از V7 (و نسخه‌های قبلی) نیاز به خرید اشتراک دارید.

 

  • تفاوت اصلی Midjourney V7 با V6 چیست؟ V7 ادعا می‌کند که درک بهتری از پرامپت‌ها دارد، کیفیت تصویر بالاتری ارائه می‌دهد (به‌خصوص در جزئیات، بافت و دست‌ها)، و قابلیت‌های جدیدی مانند Draft Mode و Personalization پیش‌فرض را معرفی کرده است.

 

  • آیا Midjourney V7 از قابلیت تصویرسازی ChatGPT بهتر است؟ مقایسه‌ی مستقیم دشوار است و به نیاز کاربر بستگی دارد. Midjourney V7 احتمالاً در تولید تصاویر با سبک هنری خاص و کیفیت بصری سینمایی برتری دارد و در تولید دست‌ها پیشرفت کرده است. ChatGPT ممکن است در ادغام با مکالمه و سهولت استفاده برای کاربران عادی مزیت داشته باشد.

 

  • چگونه می‌توانم پروفایل شخصی‌سازی Midjourney را فعال کنم؟ باید در پلتفرم Midjourney (وب‌سایت یا دیسکورد) به بخش رتبه‌بندی تصاویر بروید و حداقل ۲۰۰ جفت تصویر را با انتخاب گزینه‌ی بهتر، رتبه‌بندی کنید.

 

  • آیا می‌توانم بدون انجام شخصی‌سازی از V7 استفاده کنم؟ طبق اعلام Midjourney، برای دسترسی اولیه به نسخه‌ی آلفای V7، تکمیل پروفایل شخصی‌سازی الزامی است. اما پس از فعال شدن، گزینه‌ای برای غیرفعال کردن موقت Personalization وجود دارد.

 

 

Midjourney V7، بازگشتی قدرتمند به اوج رقابت!

 

رونمایی از Midjourney V7 Alpha، نشان‌دهنده‌ی بازگشت قدرتمند یکی از محبوب‌ترین و تأثیرگذارترین ابزارهای تولید تصویر با هوش مصنوعی به میدان رقابت است. با بهبودهای چشمگیر در درک پرامپت، کیفیت تصویر و به‌خصوص تولید آناتومی دقیق (مانند دست‌ها)، و همچنین معرفی قابلیت‌های نوآورانه‌ای مانند Draft Mode و Personalization پیش‌فرض، Midjourney قصد دارد بار دیگر جایگاه خود را به عنوان یکی از پیشگامان این عرصه تثبیت کند.

 

اگرچه این مدل هنوز در مرحله‌ی آلفا قرار دارد و برخی قابلیت‌ها در دست توسعه هستند، اما پتانسیل بالای آن مشهود است. V7 نه تنها رقابت را با غول‌هایی مانند OpenAI و Google داغ‌تر می‌کند، بلکه ابزارهای جدید و هیجان‌انگیزی را در اختیار هنرمندان و خالقان محتوا قرار می‌دهد تا مرزهای خلاقیت خود را جابجا کنند. آینده‌ی هنر دیجیتال با هوش مصنوعی، بدون شک بسیار جذاب‌تر خواهد بود! های ورت (hiwert.com)، مرجع معتبر شما برای خرید انواع کالای دیجیتال، از برندهای معتبر با بهترین قیمت.

 

های ورت، شما را با جدیدترین ابزارهای خلاقانه‌ی AI آشنا می‌کند! ❤️🎨