شرکت xAI متعلق به ایلان ماسک، قابلیت درک تصویر را به مدل هوش مصنوعی گراک (Grok) خود اضافه کرده است. این پیشرفت قابل توجه، گام مهمی در جهت افزایش تعامل گراک به شمار میرود. کاربران پولی پلتفرم اجتماعی X (توییتر) که به چتبات مبتنی بر هوش مصنوعی گراک دسترسی دارند، اکنون میتوانند تصویری آپلود کرده و از هوش مصنوعی درباره آن سؤال بپرسند. این قابلیت نوآورانه، کاربرانی را که در زمینه تحلیل تصویر فعالیت میکنند، مانند طراحان گرافیک، عکاسان و بازاریابان، قادر میسازد تا از هوش مصنوعی Grok برای درک بهتر محتوای تصویری و استخراج اطلاعات مفید از آن استفاده کنند.
مطلب پیشنهادی: معرفی گراک – چت بات جدید ایلان ماسک
حساب کاربری رسمی @grok در X، خبر بهروزرسانی را روز دوشنبه منتشر کردند. ایلان ماسک با ابراز خوشحالی از این پیشرفت، در پستی جداگانه گفت که grok با استفاده از قابلیت جدید درک تصویر، حتی میتواند معنای یک جوک را توضیح دهد. او افزود که این عملکرد در مراحل اولیه است و به سرعت بهبود خواهد یافت. این اظهارنظر نشان میدهد که xAI مصمم است با ارتقاء مستمر گراک، قابلیتهای آن را به سطح بالاتری برساند.
مطلب پیشنهادی: مشاهده خلاصه اخبار در ایکس (با هوش مصنوعی گراک)
در ماه آگوست، شرکت هوش مصنوعی ایلان ماسک، مدل Grok2 را منتشر کرد که یک نسخه ارتقا یافته از چتبات است. و با استفاده از مدل FLUX.1، قابلیت تولید تصویر را نیز دارا بود. همانند نسخههای قبلی، Grok2 برای توسعهدهندگان یا کاربران پریمیوم در پلتفرم X در دسترس قرار گرفت.
در آن زمان، xAI اعلام کرد به نسخه بعدی گراک در X و مدلی که از طریق API توسعهدهندگان ارائه میشود، درک چندوجهی (multimodal understanding) را اضافه خواهد کرد. این قابلیت به هوش مصنوعی امکان میدهد تا انواع مختلفی از دادهها مانند متن، تصویر و صدا را پردازش و درک کند. با افزوده شدن درک چندوجهی، گراک قادر خواهد بود تا اطلاعات را به طور جامعتر درک کرده و پاسخهای دقیقتر و مرتبطتری را به کاربران ارائه دهد.
Grok ممکن است به زودی اسناد را نیز درک کند. این گفته بر اساس پاسخ ایلان ماسک به کاربری است که از عدم توانایی گراک در مدیریت فرمتهای خاص فایل (مانند PDF) انتقاد کرده بود. ایلان ماسک پاسخ داد: “نه برای مدت طولانی” و ادعا کرد: “ما در ماههایی به نتیجه میرسیم که برای همه دیگران سالها طول خواهد کشید.” این اظهارنظر نشان از عزم راسخ xAI برای پیشرو بودن در عرصه هوش مصنوعی دارد.
مطلب پیشنهادی: Grok برای کاربران پریمیوم فعال شد.
شبکه اجتماعی ایکس (X) در تلاش است با افزودن ویژگیهای بیشتر هم به چتبات هوش مصنوعی و هم به سطوح کاربران پولی در X، این پلتفرم را جذابتر کند. در اوایل این ماه، X ابزار جدیدی به نام Radar را برای مشترکین Premium+ معرفی کرد تا بتوانند روندهای لحظهای را مشاهده کرده و مکالمات ترند را پیدا کنند. اضافه شدن قابلیت درک تصویر به Grok، گامی دیگر در راستای افزایش کارایی و جذابیت این پلتفرم برای کاربران حرفهای است.
مطلب پیشنهادی: قابلیت Radar برنامه ایکس چیست؟
حالت صوتی پیشرفته ChatGPT در وب OpenAI در حال گسترش قابلیت حالت صوتی پیشرفته (Advanced…
عینکهای واقعیت افزوده متا با قابلیتهای هوش مصنوعی خود متا اعلام کرد که شروع به…
بلواسکای از پستهای کاربران برای آموزش هوش مصنوعی خود استفاده نمیکند. بلواسکای، شبکه اجتماعی که…
قابلیت Genmoji اپل چیست؟ به روزرسانی iOS 18.1 اپل، مجموعه ای از ویژگیهای هوش مصنوعی…
کسب درآمد از اسپاتیفای Spotify روز چهارشنبه اعلام کرد که پادکسترهایی که ویدیوهای محبوب را…
ساخت ریمیکس با هوش مصنوعی یوتیوب سال گذشته، یوتیوب به برخی از سازندگان محتوا در…