معرفی مدل Opus 4.5؛ جهش آنتروپیک در دنیای کدنویسی و حافظه هوشمند

عناوین محتوای این مطلب

معرفی مدل Opus 4.5؛ جهش آنتروپیک در دنیای کدنویسی و حافظه هوشمند

روز دوشنبه، شرکت آنتروپیک (Anthropic) به صورت رسمی از مدل Opus 4.5 رونمایی کرد؛ جدیدترین نسخه از مدل پرچمدار این شرکت که توجه بسیاری را در دنیای هوش مصنوعی به خود جلب کرده است. این مدل، آخرین عضو از سری مدل‌های ۴.۵ آنتروپیک محسوب می‌شود که پس از عرضه Sonnet 4.5 در ماه سپتامبر و Haiku 4.5 در اکتبر، به بازار عرضه شده است.

در ادامه به بررسی قابلیت‌های فنی، بهبودهای حافظه و جایگاه این مدل در برابر رقبا می‌پردازیم.

رکوردشکنی مدل Opus 4.5 در بنچمارک‌های تخصصی

همان‌طور که انتظار می‌رفت، نسخه جدید اوپوس عملکردی در سطح “لبه تکنولوژی” (State-of-the-art) در طیف وسیعی از معیارهای ارزیابی (بنچمارک‌ها) از خود نشان داده است. این برتری به ویژه در بنچمارک‌های کدنویسی (مانند SWE-Bench و Terminal-bench)، استفاده از ابزار (tau2-bench و MCP Atlas) و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond) مشهود است.

نکته قابل توجه و تاریخی اینجاست که مدل Opus 4.5 اولین مدلی است که توانسته در بنچمارک معتبر کدنویسی “SWE-Bench Verified” امتیازی بالاتر از ۸۰ درصد کسب کند. این دستاورد نشان‌دهنده توانایی بالای این هوش مصنوعی در درک و حل مسائل پیچیده برنامه‌نویسی است.

مطلب پیشنهادی: هوش مصنوعی میتواند انسان را فریب دهد!!!

ادغام گسترده با دسکتاپ و اکسل

آنتروپیک علاوه بر قدرت پردازشی، بر قابلیت‌های “استفاده از کامپیوتر” (Computer Use) و مهارت‌های کار با صفحات گسترده در مدل Opus 4.5 تاکید ویژه‌ای داشته است. برای نمایش عملی این توانایی‌ها، تعدادی محصول موازی نیز راه‌اندازی شده‌اند.

همزمان با عرضه این مدل، آنتروپیک محصولات “Claude for Chrome” و “Claude for Excel” را که پیش‌تر در مرحله آزمایشی بودند، به صورت گسترده‌تری در دسترس قرار می‌دهد:

افزونه کروم: برای تمام کاربران سطح Max در دسترس خواهد بود.
مدل متمرکز بر اکسل: برای کاربران سطوح Max، Team و Enterprise قابل استفاده است.

تحول در مدیریت حافظه و قابلیت «چت نامحدود»

یکی از مهم‌ترین ویژگی‌های مدل Opus 4.5، بهبود چشمگیر حافظه برای عملیات‌هایی با بستر متنی طولانی (Long-context) است. این امر نیازمند تغییرات اساسی در نحوه مدیریت حافظه توسط مدل بوده است.

دایان نا پن (Dianne Na Penn) مدیر محصول بخش تحقیقات آنتروپیک، در یک گفتگو گفت:

«ما در آموزش مدل Opus 4.5 بهبودهایی در کیفیت کلی بستر متنی طولانی ایجاد کردیم، اما صرفاً داشتن پنجره‌های زمینه (Context Windows) بزرگ‌تر به تنهایی کافی نیست. دانستن اینکه کدام جزئیات دقیق باید به خاطر سپرده شوند، مکملی بسیار مهم برای صرفاً داشتن یک پنجره متنی طولانی‌تر است.»

این تغییرات زیرساختی، امکان ارائه ویژگی پرطرفدار و مورد انتظار «چت بی‌پایان» (Endless Chat) را برای کاربران پولی کلود فراهم کرده است. با این قابلیت، زمانی که مدل به سقف پنجره متنی خود می‌رسد، گفتگو قطع نمی‌شود؛ بلکه مدل بدون اینکه کاربر متوجه شود، حافظه متنی خود را فشرده‌سازی کرده و به گفتگو ادامه می‌دهد.

نقش مدل Opus 4.5 در سیستم‌های عامل‌گرا (Agentic)

بسیاری از ارتقاهای صورت گرفته‌ با نیم‌نگاهی به موارد استفاده “عامل‌گرا” (Agentic Use Cases) طراحی شده‌اند. به ویژه سناریوهایی که در آن مدل Opus 4.5 به عنوان یک “عامل رهبر” عمل کرده‌است و گروهی از زیر-عامل‌های قدرت گرفته‌ از مدل Haiku را مدیریت می‌کند.

مدیریت چنین وظایفی نیازمند تسلط قوی بر “حافظه کاری” (Working memory) است. دقیقاً همان جایی که بهبودهای حافظه توصیف شده توسط خانم پن ارزش خود را نشان می‌دهند.

پن می‌گوید:

«اینجاست که اصول بنیادی مانند حافظه اهمیت حیاتی پیدا می‌کنند؛ زیرا کلود باید بتواند در پایگاه‌های کد (Code bases) و اسناد بزرگ کاوش کند و همچنین بداند چه زمانی باید به عقب بازگردد و چیزی را مجدداً بررسی کند.»

مطلب پیشنهادی: DeepSeek در رتبه اول اپ‌استور و گوگل پلی استور قرار گرفت!

رقابت سخت با غول‌های هوش مصنوعی

با تمام این ویژگی‌ها، مدل Opus 4.5 با رقابت سنگینی از سوی دیگر مدل‌های پیشرو که اخیراً منتشر شده‌اند، روبرو خواهد شد. مهم‌ترین رقبای این مدل عبارتند از: