میدجرنی (Midjourney)، یکی از پیشگامان سرویسهای تولید تصویر با هوش مصنوعی در فضای وب، پس از حدود یک سال، از اولین مدل هوش مصنوعی تصویرساز جدید خود رونمایی کرد. این مدل جدید، که با نام Midjourney V7 شناخته میشود، نقطه عطف مهمی برای این پلتفرم محبوب به شمار میرود.
عرضه اولیه (roll out) نسخه آلفای مدل Midjourney V7 حدود نیمهشب روز پنجشنبه آغاز شد. این رونمایی تنها یک هفته پس از آن صورت گرفت که شرکت OpenAI از یک مولد تصویر در ChatGPT پردهبرداری کرد؛ مولدی که به سرعت به دلیل توانایی فوقالعادهاش در خلق تصاویر به سبک استودیو انیمیشنسازی جیبلی (Ghibli) در فضای مجازی وایرال شد.
لازم به ذکر است که مدل Midjourney V7 (حداقل به طور رسمی) به صورت تخصصی برای تولید تصاویر به سبک جیبلی بهینهسازی نشده است. با این حال، این مدل قطعاً قادر به تولید آثاری با زیباییشناسی چشمنواز است.
ما اکنون فاز تست آلفای مدل تصویر V7 جدید خود را آغاز کردهایم. این هوشمندترین، زیباترین و منسجمترین مدل ما تا به امروز است. آن را امتحان کنید و انتظار بهروزرسانیهای هفتگی یا دوهفتهای را برای دو ماه آینده داشته باشید.
مطلب پیشنهادی: ساخت عکس کارتونی با هوش مصنوعی
برای بهرهمندی از قابلیتهای Midjourney V7، ابتدا لازم است (اگر پیش از این انجام ندادهاید) با رتبهبندی حدود ۲۰۰ تصویر، یک پروفایل «شخصیسازی» (personalization) در میدجرنی برای خود ایجاد کنید.
این پروفایل به مدل کمک میکند تا خود را با ترجیحات بصری منحصر به فرد شما تطبیق دهد. نکته جالب توجه این است که Midjourney V7 اولین مدل این شرکت محسوب میشود که قابلیت شخصیسازی به طور پیشفرض در آن فعال است.
پس از تکمیل پروفایل شخصیسازی، میتوانید Midjourney V7 را به راحتی در وبسایت میدجرنی فعال یا غیرفعال کنید. همچنین، اگر عضو سرور دیسکورد (Discord) میدجرنی هستید، میتوانید این کار را از طریق ربات چت (chatbot) آن در دیسکورد انجام دهید. در اپلیکیشن وب میدجرنی، کافی است از منوی کشویی کنار برچسب “Version” (نسخه)، مدل V7 را انتخاب نمایید.
دیوید هولز (David Holz)، مدیرعامل میدجرنی، در پستی در شبکه اجتماعی X (توییتر سابق)، Midjourney V7 را دارای «معماری کاملاً متفاوتی» نسبت به نسخههای پیشین توصیف کرد.
هولز در اعلانیهای که در سرور دیسکورد منتشر کرد، جزئیات بیشتری را ارائه داد:
«Midjourney V7 در درک دستورات متنی (text prompts) بسیار هوشمندتر عمل میکند. همچنین دستورات تصویری (image prompts) نتایج فوقالعادهای ایجاد میکنند. کیفیت تصویر با بافتهای (textures) زیبا به طور محسوسی بالاتر رفته و انسجام (coherence) بدنها، دستها و انواع اشیاء در تمام جزئیات به شکل قابل توجهی بهبود یافته است.»
Midjourney V7 در دو حالت اصلی ارائه میشود:
Turbo (توربو): سریعتر اما با هزینه اجرای بالاتر.
Relax (ریلکس): حالت استاندارد با هزینه کمتر.
علاوه بر این دو، Midjourney V7 قدرتبخش ابزار جدیدی به نام Draft Mode (حالت پیشنویس) است. این حالت به کاربران اجازه میدهد تصاویر را با ۱۰ برابر سرعت و نصف هزینه حالت استاندارد رندر (render) کنند. طبیعتاً کیفیت تصاویر در حالت پیشنویس پایینتر است، اما میتوان به سادگی و با یک کلیک، آنها را بهبود بخشید (enhance) و مجدداً رندر کرد.
به گفته هولز، برخی از ویژگیهای استاندارد میدجرنی هنوز برای Midjourney V7 فعال نشدهاند. از جمله این ویژگیها میتوان به افزایش مقیاس تصویر (upscaling) و تغییر بافت (retexturing) اشاره کرد. با این حال، او اطمینان داد که این قابلیتها در آینده نزدیک، احتمالاً طی دو ماه آینده، به مدل اضافه خواهند شد.
هولز در دیسکورد نوشت:
«این یک مدل کاملاً جدید با نقاط قوت منحصر به فرد و احتمالاً چند نقطه ضعف است. ما میخواهیم از شما یاد بگیریم که [Midjourney V7] در چه زمینههایی خوب و در چه زمینههایی ضعیف عمل میکند. اما قطعاً به خاطر داشته باشید که ممکن است به سبکهای متفاوتی از دستوردهی (prompting) نیاز داشته باشد. پس کمی با آن کار کنید و قابلیتهایش را بیازمایید.»
میدجرنی سازوکار تجاری غیرمعمولی دارد. این شرکت که در سال ۲۰۲۲ توسط دیوید هولز (همبنیانگذار شرکت سازنده تجهیزات جانبی کامپیوتر Leap Motion) تأسیس شد، تاکنون هیچگونه سرمایهگذاری خارجی جذب نکرده است.
بر اساس گزارشها، انتظار میرفت میدجرنی در اواخر سال ۲۰۲۳ به درآمدی حدود ۲۰۰ میلیون دلار دست یابد. این شرکت مستقر در سانفرانسیسکو اخیراً اعلام کرده است که در حال تشکیل یک تیم سختافزاری برای کار بر روی پروژههایی نامشخص است. همچنین، میدجرنی به آموزش مدلهای هوش مصنوعی خود برای تولید ویدئو و اشیاء سهبعدی که پیشتر اعلام شده بود، ادامه میدهد.
با وجود موفقیتها، میدجرنی با چالشهای حقوقی نیز روبروست. این شرکت با چندین پرونده قضایی مواجه است که آن را متهم به نقض کپیرایت میلیونها هنرمند میکنند. شاکیان ادعا دارند که میدجرنی ابزارهای هوش مصنوعی خود را با استفاده از تصاویر جمعآوریشده (scraped) از سطح وب، بدون کسب رضایت خالقان آن تصاویر، آموزش داده است.
فروش نام کاربری ایکس: برنامه جدید ایکس برای کسب درآمد از حسابهای غیرفعال به نظر…
تیکتاک از پلتفرم جدید «تیکتاک برای هنرمندان» رونمایی میکند: ابزاری قدرتمند برای رشد و تعامل…
معرفی کامل برنامه ToonMe: جذابترین راه برای تولید عکس کارتونی در دنیای امروز که شبکههای…
تولید تصویر با OpenAI رایگان شد: قابلیت جدید GPT-4o برای همه کاربران OpenAI (شرکت پیشرو…
ساخت عکس کارتونی با هوش مصنوعی: ترند جذاب این روزهای شبکههای اجتماعی این روزها اگر…
پیامرسان سیگنال: راهنمای جامع برای حفظ حریم خصوصی و امنیت در ارتباطات آنلاین در دنیای…