پلتفرم Speechify تا پیش از این عمدتاً به عنوان ابزاری شناخته میشد که به کاربران کمک میکرد تا به مقالات، فایلهای PDF و اسناد متنی گوش دهند. اما اکنون این شرکت با افزودن ویژگیهای تشخیص صدا، گام بزرگی رو به جلو برداشته است. این ویژگیهای جدید شامل قابلیت تایپ صوتی و یک دستیار صوتی Speechify است که میتواند به سوالات شما پاسخ دهد و اکنون در افزونه کروم در دسترس قرار گرفته است.
در ۱۲ ماه گذشته، به لطف بهبود کلی کیفیت مدلهای تشخیص گفتار، شاهد رشد چشمگیر ابزارهای تشخیص صدا بودهایم. Speechify نیز با سوار شدن بر این موج، ابزار دیکته اختصاصی خود را با پشتیبانی از زبان انگلیسی راهاندازی کرده است. درست مانند سایر ابزارهای دیکته پیشرفته، تایپ صوتی Speechify نیز خطاها را اصلاح کرده و کلمات زائد (Filler words) را از متن حذف میکند.
مطلب پیشنهادی: speechify چیست؟ تبدیل متن به صدا با هوش مصنوعی
در تست کوتاهی که بیش از یک روز انجام دادیم، احساس کردیم که ابزار Speechify هنوز جای زیادی برای پیشرفت دارد. برای مثال، این ابزارها با سرویسهایی مانند جیمیل (Gmail) و گوگل داکس (Google Docs) به خوبی کار میکنند، اما در سایتهایی مانند وردپرس (WordPress)، در فعالسازی دیکته صوتی و عملکرد صحیح آن با مشکلاتی مواجه شدیم. البته این شرکت اعلام کرده است که به تدریج بهینهسازیهایی را برای سایتهای پرطرفدار اضافه خواهد کرد.
از نظر دقت، نرخ خطای کلمات در دستیار صوتی Speechify بالاتر از برخی ابزارهای دیگر مانند Wispr Flow، Willow و Monologue بود. Speechify خاطرنشان کرده است که مدل هوش مصنوعی آنها هرچه بیشتر مورد استفاده قرار گیرد، سریعتر یاد میگیرد و نرخ خطا به تدریج کاهش خواهد یافت.
این استارتاپ همچنین یک دستیار صوتی مکالمهای را راهاندازی کرده است که در نوار کناری (Sidebar) مرورگر شما قرار میگیرد. شما میتوانید از دستیار صوتی Speechify سوالاتی درباره وبسایتی که در آن هستید بپرسید؛ سوالاتی نظیر «سه ایده کلیدی این متن چیست؟» یا «این مطلب را به زبان سادهتر توضیح بده».
اگرچه ChatGPT و Gemini دارای حالتهای مکالمه هستند، اما استدلال Speechify این است که قابلیت صوتی در اپلیکیشنهای آنها به عنوان یک ویژگی جانبی (Afterthought) در نظر گرفته شده است، در حالی که ابزار این استارتاپ، صدا را در مرکز و اولویت اصلی خود قرار داده است.
روهان پاولوری (Rohan Pavuluri) مدیر ارشد کسبوکار این شرکت، طی ایمیلی به تککرانچ گفت:
«ما معتقدیم که وقتی اپلیکیشنهای ChatGPT و Gemini را باز میکنید، چت متنی همیشه تجربه کاربری پیشفرض باقی خواهد ماند؛ زیرا این چیزی است که کاربرانشان انتظار دارند. در آنجا، صدا همیشه در درجه دوم و در بسیاری موارد یک ویژگی جانبی خواهد بود. ما از چندین سال تجربه ساخت Speechify میدانیم که بخش بزرگی از بازار، شامل کاربران خودمان، وجود دارند که میخواهند هر بار که اپلیکیشنی را باز میکنند و با هوش مصنوعی صحبت میکنند، “صدا” تنظیمات پیشفرض و اولیه آنها باشد.»
مطلب پیشنهادی: Project Super Sonic – تولید صدا با نرم افزار Adobe
یکی از مشکلات قابل توجه در حال حاضر این است که دستیار صوتی Speechify با مرورگرهایی که خودشان دارای دستیارهای نوار کناری داخلی هستند (مانند Atlas از OpenAI، Comet از Perplexity و مرورگر Dia) کار نمیکند. البته این استارتاپ نگرانی زیادی بابت این موضوع ندارد، زیرا این افزونه عمدتاً برای مرورگر کروم و پایگاه کاربری عظیم آن طراحی شدهاست.
Speechify اعلام کرده است که قصد دارد به تدریج هر دو قابلیت تایپ صوتی و دستیار صوتی را در تمام اپلیکیشنهای خود در دسکتاپ و موبایل بگنجاند.
این استارتاپ همچنین قصد دارد ایجنتها یا همان نمایندگان هوشمندی را توسعه دهد که وظایف را به نیابت از شما انجام میدهند. Speechify نقشه راه کامل خود را فاش نکرد، اما یک مثال ارائه داد: برقراری تماس برای گرفتن وقت ملاقات یا منتظر ماندن پشت خط پشتیبانی مشتریان یک شرکت. شرکتهای دیگری مانند Truecaller و Cloacked نیز اهداف مشابهی را دنبال میکنند.
معرفی مدل Opus 4.5؛ جهش آنتروپیک در دنیای کدنویسی و حافظه هوشمند روز دوشنبه، شرکت…
مقابله با رباتها؛ قابلیت جدید پروفایل ایکس برای نمایش جزئیات حساب کاربری شبکه اجتماعی ایکس…
بازگشت قابلیت پیام خصوصی یوتیوب: امکان چت مستقیم دوباره فعال میشود پس از آنکه یوتیوب…
نوت واتساپ چیست؟ تحول بخش «About» با الهام از اینستاگرام واتساپ در حال دریافت نسخهای…
تحولی در تجربه شنیداری؛ معرفی قابلیتهای جدید اسپاتیفای (SongDNA و About the Song) اسپاتیفای روز…
رونمایی گوگل از Gemini 3؛ جهش بزرگ در استدلال و کدنویسی هوش مصنوعی گوگل روز…