متا در اقدامی غافلگیرکننده و در روز شنبه، مجموعه جدیدی از مدلهای هوش مصنوعی خود به نام لاما ۴ (Llama 4) را به خانواده لاما اضافه کرد. این رونمایی، فصلی تازه در توسعه مدلهای زبانی بزرگ این شرکت محسوب میشود.
در مجموع چهار مدل جدید در این خانواده معرفی شدهاند: لاما ۴ اسکاوت (Llama 4 Scout)، لاما ۴ ماوریک (Llama 4 Maverick) و لاما ۴ بِهیموث (Llama 4 Behemoth). تمام این مدلها با استفاده از «مقادیر عظیمی از دادههای متنی، تصویری و ویدیویی بدون برچسب» آموزش دیدهاند تا «درک بصری گستردهای» کسب کنند.
مطلب پیشنهادی: هوش مصنوعی Llama چیست؟
گزارشها حاکی از آن است که موفقیت مدلهای متنباز آزمایشگاه هوش مصنوعی چینی DeepSeek، که عملکردی همتراز یا حتی بهتر از مدلهای پرچمدار قبلی لاما متا (مانند Llama 3) دارند، توسعه خانواده Llama 4را به شدت تسریع کرده است. طبق شایعات متا با تشکیل تیمهای ویژه (war rooms) در تلاش است تا رمزگشایی کند که DeepSeek چگونه توانستهاست هزینه اجرا و پیادهسازی مدلهایی مانند R1 و V3 را کاهش دهد.
مدلهای اسکاوت و ماوریک از خانواده لاما ۴ به صورت متنباز در وبسایت Llama.com و از طریق شرکای متا، از جمله پلتفرم محبوب توسعهدهندگان هوش مصنوعی Hugging Face، در دسترس قرار گرفتهاند. با این حال، مدل قدرتمندتر یعنی بِهیموث (Behemoth) همچنان در مرحله آموزش قرار دارد.
متا همچنین اعلام کرد که Meta AI (دستیار هوش مصنوعی این شرکت که در اپلیکیشنهایی نظیر واتساپ، مسنجر و اینستاگرام ادغام شدهاست) در ۴۰ کشور جهان برای استفاده از Llama 4 بهروزرسانی شدهاست. البته قابلیتهای چندوجهی (پردازش همزمان متن، تصویر و ویدیو) فعلاً به زبان انگلیسی و برای کاربران داخل ایالات متحده محدود است.
برخی توسعهدهندگان ممکن است با شرایط مجوز Llama 4 مواجه شوند. کاربران و شرکتهایی که «محل اقامت» یا «محل اصلی کسبوکار» آنها در اتحادیه اروپا قرار دارد، از استفاده یا توزیع این مدلها منع شدهاند. این محدودیت به احتمال زیاد ناشی از الزامات حاکمیتی قوانین هوش مصنوعی و حریم خصوصی دادهها در این منطقه است. (قوانینی که متا پیشتر آنها را بیش از حد دستوپاگیر خواندهبود). علاوه بر این، همانند نسخههای پیشین لاما، شرکتهایی که بیش از ۷۰۰ میلیون کاربر فعال ماهانه دارند، ملزم به درخواست مجوز ویژه از متا هستند و متا این اختیار را دارد که بنا به صلاحدید خود، این درخواست را بپذیرد یا رد کند.
متا در یک پست وبلاگی نوشت: «این مدلهای لاما ۴ سرآغاز دوره جدیدی برای اکوسیستم لاما هستند… این تازه شروع ماجرا برای مجموعه لاما ۴ است.»
طبق آزمایشهای داخلی متا:
1. ماوریک (Maverick): این مدل که به گفته متا برای کاربردهای «دستیار عمومی و چت» مانند نویسندگی خلاق بهترین گزینه است، در برخی بنچمارکهای مهم مانند کدنویسی، استدلال، چندزبانگی، درک متن طولانی (long-context) و پردازش تصویر، عملکردی بهتر از مدلهایی نظیر GPT-4o OpenAI و Gemini 2.0 گوگل از خود نشان داده است. با این حال، ماوریک هنوز به سطح مدلهای بسیار توانمند اخیر مانند Gemini 2.5 Pro گوگل، Claude 3.7 Sonnet انتروپیک و GPT-4.5 OpenAI نمیرسد.
2. اسکاوت (Scout): نقاط قوت اصلی اسکاوت در وظایفی چون خلاصهسازی اسناد و استدلال بر روی پایگاههای کد (codebases) بزرگ است. ویژگی منحصربهفرد آن، پنجره زمینه (context window) بسیار بزرگ آن یعنی ۱۰ میلیون توکن است. («توکن» به واحدهای کوچک متن خام گفته میشود؛ مثلاً کلمه «فوقالعاده» ممکن است به توکنهای «فوق» و «العاده» تجزیه شود). به زبان سادهتر، اسکاوت میتواند تصاویر و حجم عظیمی از متن (معادل میلیونها کلمه) را به عنوان ورودی دریافت کند و اسناد بسیار طولانی را پردازش نماید.
3. بِهیموث (Behemoth): این مدل که هنوز منتشر نشده، طبق بنچمارکهای داخلی متا، در ارزیابیهای متعدد مربوط به مهارتهای STEM (علوم، فناوری، مهندسی و ریاضیات) مانند حل مسائل ریاضی، از GPT-4.5، Claude 3.7 Sonnet و Gemini 2.0 Pro (اما نه نسخه ۲.۵ Pro) عملکرد بهتری دارد.
نکته مهم: هیچکدام از مدلهای لاما ۴ فعلی، یک مدل «استدلالی» (Reasoning Model) به معنای دقیق کلمه (مانند مدلهای o1 و o3-mini از OpenAI) نیستند. مدلهای استدلالی قبل از پاسخدهی، صحت اطلاعات را بررسی میکنند و پاسخهای قابل اعتمادتری ارائه میدهند، اما معمولاً کندتر از مدلهای سنتی عمل میکنند.
نکته جالب توجه دیگر در مورد لاما ۴ این است که متا اعلام کرده این مدلها را طوری تنظیم کرده که کمتر از پاسخ دادن به سوالات «بحثبرانگیز» (contentious) خودداری کنند.
به گفته این شرکت، لاما ۴ به موضوعات سیاسی و اجتماعی «مورد مناقشه» که نسل قبلی مدلهای لاما از پاسخ به آنها امتناع میکردند، واکنش نشان میدهد. علاوه بر این، متا ادعا میکند که لاما ۴ در مورد اینکه کدام درخواستها را به طور کامل رد میکند، «بهطور چشمگیری متعادلتر» عمل میکند.
یک سخنگوی متا گفت: «میتوانید روی [لاما ۴] حساب کنید تا پاسخهایی مفید و مبتنی بر واقعیت، بدون قضاوت ارائه دهد… ما به بهبود پاسخگویی لاما ادامه میدهیم تا به سوالات بیشتری پاسخ دهد، بتواند به دیدگاههای گوناگون واکنش نشان دهد […] و دیدگاه خاصی را بر دیگری ترجیح ندهد.»
هوش مصنوعی Veo 2 از راه رسید: تولید ویدیو برای کاربران Gemini Advanced گوگل در…
قابلیتهای جدید بلواسکای: تجربهای آشناتر برای کاربران سابق ایکس شبکه اجتماعی بلواسکای در حال انتشار…
تولید موزیک با هوش مصنوعی یوتیوب: ساخت موسیقی پسزمینه رایگان و سفارشی برای ویدیوهای شما…
قابلیتهای جدید واتساپ: ارتقای تجربه کاربری در چت، تماس و کانالها واتساپ، در رقابت مداوم…
دنبال کردن کاربران ایکس در تردز: قابلیت جدید متا برای رقابت با شبکه ایلان ماسک…
یوتیوب برنامه شناسایی محتوای هوش مصنوعی خود را گسترش میدهد و از قانون NO FAKES…