شرکت xAI متعلق به ایلان ماسک، قابلیت درک تصویر را به مدل هوش مصنوعی گراک (Grok) خود اضافه کرده است. این پیشرفت قابل توجه، گام مهمی در جهت افزایش تعامل گراک به شمار میرود. کاربران پولی پلتفرم اجتماعی X (توییتر) که به چتبات مبتنی بر هوش مصنوعی گراک دسترسی دارند، اکنون میتوانند تصویری آپلود کرده و از هوش مصنوعی درباره آن سؤال بپرسند. این قابلیت نوآورانه، کاربرانی را که در زمینه تحلیل تصویر فعالیت میکنند، مانند طراحان گرافیک، عکاسان و بازاریابان، قادر میسازد تا از هوش مصنوعی Grok برای درک بهتر محتوای تصویری و استخراج اطلاعات مفید از آن استفاده کنند.
مطلب پیشنهادی: معرفی گراک – چت بات جدید ایلان ماسک
حساب کاربری رسمی @grok در X، خبر بهروزرسانی را روز دوشنبه منتشر کردند. ایلان ماسک با ابراز خوشحالی از این پیشرفت، در پستی جداگانه گفت که grok با استفاده از قابلیت جدید درک تصویر، حتی میتواند معنای یک جوک را توضیح دهد. او افزود که این عملکرد در مراحل اولیه است و به سرعت بهبود خواهد یافت. این اظهارنظر نشان میدهد که xAI مصمم است با ارتقاء مستمر گراک، قابلیتهای آن را به سطح بالاتری برساند.
مطلب پیشنهادی: مشاهده خلاصه اخبار در ایکس (با هوش مصنوعی گراک)
در ماه آگوست، شرکت هوش مصنوعی ایلان ماسک، مدل Grok2 را منتشر کرد که یک نسخه ارتقا یافته از چتبات است. و با استفاده از مدل FLUX.1، قابلیت تولید تصویر را نیز دارا بود. همانند نسخههای قبلی، Grok2 برای توسعهدهندگان یا کاربران پریمیوم در پلتفرم X در دسترس قرار گرفت.
در آن زمان، xAI اعلام کرد به نسخه بعدی گراک در X و مدلی که از طریق API توسعهدهندگان ارائه میشود، درک چندوجهی (multimodal understanding) را اضافه خواهد کرد. این قابلیت به هوش مصنوعی امکان میدهد تا انواع مختلفی از دادهها مانند متن، تصویر و صدا را پردازش و درک کند. با افزوده شدن درک چندوجهی، گراک قادر خواهد بود تا اطلاعات را به طور جامعتر درک کرده و پاسخهای دقیقتر و مرتبطتری را به کاربران ارائه دهد.
Grok ممکن است به زودی اسناد را نیز درک کند. این گفته بر اساس پاسخ ایلان ماسک به کاربری است که از عدم توانایی گراک در مدیریت فرمتهای خاص فایل (مانند PDF) انتقاد کرده بود. ایلان ماسک پاسخ داد: “نه برای مدت طولانی” و ادعا کرد: “ما در ماههایی به نتیجه میرسیم که برای همه دیگران سالها طول خواهد کشید.” این اظهارنظر نشان از عزم راسخ xAI برای پیشرو بودن در عرصه هوش مصنوعی دارد.
مطلب پیشنهادی: Grok برای کاربران پریمیوم فعال شد.
شبکه اجتماعی ایکس (X) در تلاش است با افزودن ویژگیهای بیشتر هم به چتبات هوش مصنوعی و هم به سطوح کاربران پولی در X، این پلتفرم را جذابتر کند. در اوایل این ماه، X ابزار جدیدی به نام Radar را برای مشترکین Premium+ معرفی کرد تا بتوانند روندهای لحظهای را مشاهده کرده و مکالمات ترند را پیدا کنند. اضافه شدن قابلیت درک تصویر به Grok، گامی دیگر در راستای افزایش کارایی و جذابیت این پلتفرم برای کاربران حرفهای است.
مطلب پیشنهادی: قابلیت Radar برنامه ایکس چیست؟
معرفی کامل اپلیکیشن Edits متا: جایگزین قدرتمند CapCut برای ویرایش ویدیو متا به تازگی از…
Perplexity Labs: ابزار هوش مصنوعی جدید Perplexity برای گزارشسازی و تحلیل پیشرفته شرکت Perplexity (موتور…
انقلابی در جستجوی بصری: لنز گوگل به یوتیوب Shorts میآید! یوتیوب روز پنجشنبه اعلام کرد…
تحول بزرگ در Google Photos: ویرایشگر جدید با هوش مصنوعی از راه رسید! گوگل به…
حالت صوتی Claude: گامی نو از انتروپیک برای تجربه گفتگوی طبیعیتر با هوش مصنوعی شرکت…
واتس اپ برای آیپد رسماً عرضه شد: تجربه کامل پیامرسانی در تبلت اپل سرانجام پس…