دسته بندی: اخبار تکنولوژی

AI coustics – حذف نویز محیط از ویس و فیلم

ضبط‌ مصاحبه‌های پر سر و صدای و سخنرانی‌ها کابوس صدابرداران هستند. اما یک استارت‌آپ آلمانی (AI coustics) امیدوار است با رویکرد فنی منحصربه‌فردی که از هوش مصنوعی برای بهبود وضوح صدا در ویدیوها استفاده می‌کند، این مشکل را حل کند.

معرفی AI coustics

امروز، شرکت AI coustics با ۱.۹ میلیون یورو بودجه از خفا خارج شد. طبق گفته فابیان سایپل، هم‌بنیانگذار و مدیرعامل، فناوری AI coustics فراتر از حذف نویز استاندارد عمل می‌کند و در تمام دستگاه‌ها و با هر بلندگویی کار می‌کند.

سایپل در مصاحبه‌ای با TechCrunch گفت: «ماموریت اصلی ما این است که هر تعامل دیجیتالی، چه در تماس کنفرانسی، دستگاه مصرف‌کننده یا ویدیوی معمولی رسانه‌های اجتماعی، به شفافیت یک پخش از یک استودیوی حرفه‌ای برسد.»

سایپل گفت: «ما تحت تأثیر یک ماموریت شخصی برای غلبه بر چالش فراگیر کیفیت پایین صدا در ارتباطات دیجیتال بوده‌ایم. در حالی که شنوایی من به دلیل تولید موسیقی در اوایل بیست سالگی کمی ضعیف شده است، اما همیشه با محتوای آنلاین و سخنرانی‌ها مشکل داشتم که این موضوع ما را به سمت کار روی کیفیت و وضوح گفتار سوق داد.»

جایگاه AI coustics  در بین رقیبان

بازار نرم‌افزار حذف نویز و تقویت صدا با هوش مصنوعی از قبل بسیار پررونق است. رقبای این پلتفرم شامل Insoundz، که از هوش مصنوعی تولیدکننده برای بهبود کلیپ‌های صوتی استریم‌شده و ضبط‌شده استفاده می‌کند، و Veed.io، یک مجموعه ویرایش ویدئو با ابزارهایی برای حذف نویز پس‌زمینه از کلیپ‌ها می‌شود.

اما سایپل می‌گوید AI-coustics رویکرد منحصربه‌فردی برای توسعه مکانیسم‌های هوش مصنوعی که کار حذف نویز واقعی را انجام می‌دهند، دارد.

مکانیسم منحصر به فرد این نرم افزار

این استارت‌آپ از مدلی استفاده می‌کند که روی نمونه‌های صوتی ضبط‌شده در استودیوی این شرکت در برلین، شهر محل فعالیت AI-coustics، آموزش دیده است. به افرادی که نمونه‌هایی را ضبط می‌کنند پول پرداخت می‌شود و سپس آن نمونه‌ها به مجموعه‌ای از داده‌ها اضافه می‌شوند تا مدل کاهش نویز AI-coustics آموزش ببیند.

سایپل گفت: «ما رویکرد منحصربه‌فردی را برای شبیه‌سازی مصنوعی صدا و مشکلات – مانند نویز، انعکاس، فشرده‌سازی، میکروفون‌های با محدوده باند، بریدگی و غیره – در طول فرآیند آموزش توسعه دادیم.»

من حدس می‌زنم که برخی با طرح پرداخت یک‌بار مصرف این برنامه برای تولیدکنندگان محتوا مخالف خواهند بود، زیرا مدلی که این استارت‌آپ در حال آموزش آن است، در درازمدت می‌تواند بسیار سودآور شود. اما شاید نگرانی بزرگ‌تر و فوری‌تر، سوگیری باشد.

مشکلات احتمالی AI coustics

به خوبی ثابت شده است که الگوریتم‌های تشخیص گفتار می‌توانند سوگیری‌هایی را ایجاد کنند. سوگیری‌هایی که در نهایت به کاربران آسیب می‌رسانند. مطالعه‌ای که در مجموعه مقالات آکادمی ملی علوم منتشر شد، نشان داد که تشخیص گفتار از شرکت‌های پیشرو، دو برابر بیشتر احتمال داشت که صدای افراد سیاه‌پوست را نسبت به افراد سفید اشتباه کند.

سایپل می‌گوید این هوشی مصنوعی برای مقابله با این مشکل، بر جذب مشارکت‌کنندگان نمونه‌های گفتار «متنوع» تمرکز می‌کند. او افزود: «حجم و تنوع برای از بین بردن سوگیری و کارکرد این فناوری برای تمام زبان‌ها، هویت‌های گویشور، سن، لهجه و جنسیت‌ها کلیدی است.

اهداف این هوش مصنوعی

سایپل پیش بینی می کند که از فناوری AI-coustics برای بهبود گفتار در زمان واقعی و ضبط شده استفاده شود، و شاید حتی در دستگاه هایی مانند ساندبارها، تلفن های هوشمند و هدفون ها برای افزایش خودکار وضوح صدا تعبیه شود.

در حال حاضر، AI-coustics یک برنامه وب و API برای پردازش ضبط های صوتی و تصویری و یک SDK ارائه می دهد که پلتفرم AI-coustics را به گردش کار، برنامه ها و سخت افزارهای موجود وارد می کند.

خرید شماره مجازی
به صورت آنی شماره مجازی مورد نظر خود را خریداری کنید
خرید سریع شماره مجازی
حسن شریفی

پست های اخیر

معرفی فید نزدیک تیک‌تاک (Nearby Feed)؛ قابلیت جدید برای کشف محتوای محلی

معرفی فید نزدیک تیک‌تاک (Nearby Feed)؛ قابلیت جدید برای کشف محتوای محلی تیک‌تاک قابلیت تازه‌ای…

1 ساعت پیش

مروری جامع بر ویژگی‌های جدید و هیجان‌انگیز اسپاتیفای رپد 2025

اسپاتیفای رپد 2025؛ بازگشت قدرتمند با ویژگی‌های تعاملی جدید اسپاتیفای رپد بازگشته است؛ اما این‌بار…

24 ساعت پیش

رد دد ریدمپشن موبایل در سرویس بازی‌های نتفلیکس؛ آغاز دوره‌ای تازه برای طرفداران

رد دد ریدمپشن موبایل در سرویس بازی‌های نتفلیکس؛ آغاز دوره‌ای تازه برای طرفداران بازی رد…

2 روز پیش

هوش مصنوعی Gamma؛ خداحافظی با پاورپوینت‌های خسته‌کننده

هوش مصنوعی Gamma؛ خداحافظی با پاورپوینت‌های خسته‌کننده دنیای تکنولوژی با سرعتی باورنکردنی در حال تغییر…

3 روز پیش

تحولی در Speechify: اضافه شدن تایپ صوتی و دستیار هوشمند به مرورگر کروم

تحولی در Speechify: اضافه شدن تایپ صوتی و دستیار هوشمند به مرورگر کروم پلتفرم Speechify…

1 هفته پیش

معرفی مدل Opus 4.5؛ جهش آنتروپیک در دنیای کدنویسی و حافظه هوشمند

معرفی مدل Opus 4.5؛ جهش آنتروپیک در دنیای کدنویسی و حافظه هوشمند روز دوشنبه، شرکت…

1 هفته پیش