روز دوشنبه، شرکت آنتروپیک (Anthropic) به صورت رسمی از مدل Opus 4.5 رونمایی کرد؛ جدیدترین نسخه از مدل پرچمدار این شرکت که توجه بسیاری را در دنیای هوش مصنوعی به خود جلب کرده است. این مدل، آخرین عضو از سری مدلهای ۴.۵ آنتروپیک محسوب میشود که پس از عرضه Sonnet 4.5 در ماه سپتامبر و Haiku 4.5 در اکتبر، به بازار عرضه شده است.
در ادامه به بررسی قابلیتهای فنی، بهبودهای حافظه و جایگاه این مدل در برابر رقبا میپردازیم.
همانطور که انتظار میرفت، نسخه جدید اوپوس عملکردی در سطح “لبه تکنولوژی” (State-of-the-art) در طیف وسیعی از معیارهای ارزیابی (بنچمارکها) از خود نشان داده است. این برتری به ویژه در بنچمارکهای کدنویسی (مانند SWE-Bench و Terminal-bench)، استفاده از ابزار (tau2-bench و MCP Atlas) و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond) مشهود است.
نکته قابل توجه و تاریخی اینجاست که مدل Opus 4.5 اولین مدلی است که توانسته در بنچمارک معتبر کدنویسی “SWE-Bench Verified” امتیازی بالاتر از ۸۰ درصد کسب کند. این دستاورد نشاندهنده توانایی بالای این هوش مصنوعی در درک و حل مسائل پیچیده برنامهنویسی است.
مطلب پیشنهادی: هوش مصنوعی میتواند انسان را فریب دهد!!!
آنتروپیک علاوه بر قدرت پردازشی، بر قابلیتهای “استفاده از کامپیوتر” (Computer Use) و مهارتهای کار با صفحات گسترده در مدل Opus 4.5 تاکید ویژهای داشته است. برای نمایش عملی این تواناییها، تعدادی محصول موازی نیز راهاندازی شدهاند.
همزمان با عرضه این مدل، آنتروپیک محصولات “Claude for Chrome” و “Claude for Excel” را که پیشتر در مرحله آزمایشی بودند، به صورت گستردهتری در دسترس قرار میدهد:
یکی از مهمترین ویژگیهای مدل Opus 4.5، بهبود چشمگیر حافظه برای عملیاتهایی با بستر متنی طولانی (Long-context) است. این امر نیازمند تغییرات اساسی در نحوه مدیریت حافظه توسط مدل بوده است.
دایان نا پن (Dianne Na Penn) مدیر محصول بخش تحقیقات آنتروپیک، در یک گفتگو گفت:
«ما در آموزش مدل Opus 4.5 بهبودهایی در کیفیت کلی بستر متنی طولانی ایجاد کردیم، اما صرفاً داشتن پنجرههای زمینه (Context Windows) بزرگتر به تنهایی کافی نیست. دانستن اینکه کدام جزئیات دقیق باید به خاطر سپرده شوند، مکملی بسیار مهم برای صرفاً داشتن یک پنجره متنی طولانیتر است.»
این تغییرات زیرساختی، امکان ارائه ویژگی پرطرفدار و مورد انتظار «چت بیپایان» (Endless Chat) را برای کاربران پولی کلود فراهم کرده است. با این قابلیت، زمانی که مدل به سقف پنجره متنی خود میرسد، گفتگو قطع نمیشود؛ بلکه مدل بدون اینکه کاربر متوجه شود، حافظه متنی خود را فشردهسازی کرده و به گفتگو ادامه میدهد.
بسیاری از ارتقاهای صورت گرفته با نیمنگاهی به موارد استفاده “عاملگرا” (Agentic Use Cases) طراحی شدهاند. به ویژه سناریوهایی که در آن مدل Opus 4.5 به عنوان یک “عامل رهبر” عمل کردهاست و گروهی از زیر-عاملهای قدرت گرفته از مدل Haiku را مدیریت میکند.
مدیریت چنین وظایفی نیازمند تسلط قوی بر “حافظه کاری” (Working memory) است. دقیقاً همان جایی که بهبودهای حافظه توصیف شده توسط خانم پن ارزش خود را نشان میدهند.
پن میگوید:
«اینجاست که اصول بنیادی مانند حافظه اهمیت حیاتی پیدا میکنند؛ زیرا کلود باید بتواند در پایگاههای کد (Code bases) و اسناد بزرگ کاوش کند و همچنین بداند چه زمانی باید به عقب بازگردد و چیزی را مجدداً بررسی کند.»
مطلب پیشنهادی: DeepSeek در رتبه اول اپاستور و گوگل پلی استور قرار گرفت!
با تمام این ویژگیها، مدل Opus 4.5 با رقابت سنگینی از سوی دیگر مدلهای پیشرو که اخیراً منتشر شدهاند، روبرو خواهد شد. مهمترین رقبای این مدل عبارتند از:
باید دید که آیا تمرکز آنتروپیک بر کیفیت حافظه و ابزارهای کاربردی، میتواند سهم بازار را به نفع این شرکت تغییر دهد یا خیر.
انقلاب در گردش کار توسعهدهندگان با ورود «کلود کد» به اسلک شرکت آنتروپیک (Anthropic) در…
OpenAI و چالشهای جدید: حقیقت ماجرای تبلیغات در ChatGPT چیست؟ با وجود اینکه شرکت OpenAI…
رونمایی از هاب پشتیبانی جدید متا؛ تحولی در خدمات کاربران فیسبوک و اینستاگرام متا (Meta)…
معرفی فید نزدیک تیکتاک (Nearby Feed)؛ قابلیت جدید برای کشف محتوای محلی تیکتاک قابلیت تازهای…
اسپاتیفای رپد 2025؛ بازگشت قدرتمند با ویژگیهای تعاملی جدید اسپاتیفای رپد بازگشته است؛ اما اینبار…
رد دد ریدمپشن موبایل در سرویس بازیهای نتفلیکس؛ آغاز دورهای تازه برای طرفداران بازی رد…