روز دوشنبه، شرکت آنتروپیک (Anthropic) به صورت رسمی از مدل Opus 4.5 رونمایی کرد؛ جدیدترین نسخه از مدل پرچمدار این شرکت که توجه بسیاری را در دنیای هوش مصنوعی به خود جلب کرده است. این مدل، آخرین عضو از سری مدلهای ۴.۵ آنتروپیک محسوب میشود که پس از عرضه Sonnet 4.5 در ماه سپتامبر و Haiku 4.5 در اکتبر، به بازار عرضه شده است.
در ادامه به بررسی قابلیتهای فنی، بهبودهای حافظه و جایگاه این مدل در برابر رقبا میپردازیم.
همانطور که انتظار میرفت، نسخه جدید اوپوس عملکردی در سطح “لبه تکنولوژی” (State-of-the-art) در طیف وسیعی از معیارهای ارزیابی (بنچمارکها) از خود نشان داده است. این برتری به ویژه در بنچمارکهای کدنویسی (مانند SWE-Bench و Terminal-bench)، استفاده از ابزار (tau2-bench و MCP Atlas) و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond) مشهود است.
نکته قابل توجه و تاریخی اینجاست که مدل Opus 4.5 اولین مدلی است که توانسته در بنچمارک معتبر کدنویسی “SWE-Bench Verified” امتیازی بالاتر از ۸۰ درصد کسب کند. این دستاورد نشاندهنده توانایی بالای این هوش مصنوعی در درک و حل مسائل پیچیده برنامهنویسی است.
مطلب پیشنهادی: هوش مصنوعی میتواند انسان را فریب دهد!!!
آنتروپیک علاوه بر قدرت پردازشی، بر قابلیتهای “استفاده از کامپیوتر” (Computer Use) و مهارتهای کار با صفحات گسترده در مدل Opus 4.5 تاکید ویژهای داشته است. برای نمایش عملی این تواناییها، تعدادی محصول موازی نیز راهاندازی شدهاند.
همزمان با عرضه این مدل، آنتروپیک محصولات “Claude for Chrome” و “Claude for Excel” را که پیشتر در مرحله آزمایشی بودند، به صورت گستردهتری در دسترس قرار میدهد:
یکی از مهمترین ویژگیهای مدل Opus 4.5، بهبود چشمگیر حافظه برای عملیاتهایی با بستر متنی طولانی (Long-context) است. این امر نیازمند تغییرات اساسی در نحوه مدیریت حافظه توسط مدل بوده است.
دایان نا پن (Dianne Na Penn) مدیر محصول بخش تحقیقات آنتروپیک، در یک گفتگو گفت:
«ما در آموزش مدل Opus 4.5 بهبودهایی در کیفیت کلی بستر متنی طولانی ایجاد کردیم، اما صرفاً داشتن پنجرههای زمینه (Context Windows) بزرگتر به تنهایی کافی نیست. دانستن اینکه کدام جزئیات دقیق باید به خاطر سپرده شوند، مکملی بسیار مهم برای صرفاً داشتن یک پنجره متنی طولانیتر است.»
این تغییرات زیرساختی، امکان ارائه ویژگی پرطرفدار و مورد انتظار «چت بیپایان» (Endless Chat) را برای کاربران پولی کلود فراهم کرده است. با این قابلیت، زمانی که مدل به سقف پنجره متنی خود میرسد، گفتگو قطع نمیشود؛ بلکه مدل بدون اینکه کاربر متوجه شود، حافظه متنی خود را فشردهسازی کرده و به گفتگو ادامه میدهد.
بسیاری از ارتقاهای صورت گرفته با نیمنگاهی به موارد استفاده “عاملگرا” (Agentic Use Cases) طراحی شدهاند. به ویژه سناریوهایی که در آن مدل Opus 4.5 به عنوان یک “عامل رهبر” عمل کردهاست و گروهی از زیر-عاملهای قدرت گرفته از مدل Haiku را مدیریت میکند.
مدیریت چنین وظایفی نیازمند تسلط قوی بر “حافظه کاری” (Working memory) است. دقیقاً همان جایی که بهبودهای حافظه توصیف شده توسط خانم پن ارزش خود را نشان میدهند.
پن میگوید:
«اینجاست که اصول بنیادی مانند حافظه اهمیت حیاتی پیدا میکنند؛ زیرا کلود باید بتواند در پایگاههای کد (Code bases) و اسناد بزرگ کاوش کند و همچنین بداند چه زمانی باید به عقب بازگردد و چیزی را مجدداً بررسی کند.»
مطلب پیشنهادی: DeepSeek در رتبه اول اپاستور و گوگل پلی استور قرار گرفت!
با تمام این ویژگیها، مدل Opus 4.5 با رقابت سنگینی از سوی دیگر مدلهای پیشرو که اخیراً منتشر شدهاند، روبرو خواهد شد. مهمترین رقبای این مدل عبارتند از:
باید دید که آیا تمرکز آنتروپیک بر کیفیت حافظه و ابزارهای کاربردی، میتواند سهم بازار را به نفع این شرکت تغییر دهد یا خیر.
تحولی در Speechify: اضافه شدن تایپ صوتی و دستیار هوشمند به مرورگر کروم پلتفرم Speechify…
مقابله با رباتها؛ قابلیت جدید پروفایل ایکس برای نمایش جزئیات حساب کاربری شبکه اجتماعی ایکس…
بازگشت قابلیت پیام خصوصی یوتیوب: امکان چت مستقیم دوباره فعال میشود پس از آنکه یوتیوب…
نوت واتساپ چیست؟ تحول بخش «About» با الهام از اینستاگرام واتساپ در حال دریافت نسخهای…
تحولی در تجربه شنیداری؛ معرفی قابلیتهای جدید اسپاتیفای (SongDNA و About the Song) اسپاتیفای روز…
رونمایی گوگل از Gemini 3؛ جهش بزرگ در استدلال و کدنویسی هوش مصنوعی گوگل روز…