AI coustics - حذف نویز محیط از ویس و فیلم - وبلاگ شماره مجازی نامبرفور

ضبط‌ مصاحبه‌های پر سر و صدای و سخنرانی‌ها کابوس صدابرداران هستند. اما یک استارت‌آپ آلمانی (AI coustics) امیدوار است با رویکرد فنی منحصربه‌فردی که از هوش مصنوعی برای بهبود وضوح صدا در ویدیوها استفاده می‌کند، این مشکل را حل کند.

عناوین محتوای این مطلب

معرفی AI coustics

امروز، شرکت AI coustics با ۱.۹ میلیون یورو بودجه از خفا خارج شد. طبق گفته فابیان سایپل، هم‌بنیانگذار و مدیرعامل، فناوری AI coustics فراتر از حذف نویز استاندارد عمل می‌کند و در تمام دستگاه‌ها و با هر بلندگویی کار می‌کند.

سایپل در مصاحبه‌ای با TechCrunch گفت: «ماموریت اصلی ما این است که هر تعامل دیجیتالی، چه در تماس کنفرانسی، دستگاه مصرف‌کننده یا ویدیوی معمولی رسانه‌های اجتماعی، به شفافیت یک پخش از یک استودیوی حرفه‌ای برسد.»

سایپل گفت: «ما تحت تأثیر یک ماموریت شخصی برای غلبه بر چالش فراگیر کیفیت پایین صدا در ارتباطات دیجیتال بوده‌ایم. در حالی که شنوایی من به دلیل تولید موسیقی در اوایل بیست سالگی کمی ضعیف شده است، اما همیشه با محتوای آنلاین و سخنرانی‌ها مشکل داشتم که این موضوع ما را به سمت کار روی کیفیت و وضوح گفتار سوق داد.»

AI coustics

جایگاه AI coustics در بین رقیبان

بازار نرم‌افزار حذف نویز و تقویت صدا با هوش مصنوعی از قبل بسیار پررونق است. رقبای این پلتفرم شامل Insoundz، که از هوش مصنوعی تولیدکننده برای بهبود کلیپ‌های صوتی استریم‌شده و ضبط‌شده استفاده می‌کند، و Veed.io، یک مجموعه ویرایش ویدئو با ابزارهایی برای حذف نویز پس‌زمینه از کلیپ‌ها می‌شود.

اما سایپل می‌گوید AI-coustics رویکرد منحصربه‌فردی برای توسعه مکانیسم‌های هوش مصنوعی که کار حذف نویز واقعی را انجام می‌دهند، دارد.

مکانیسم منحصر به فرد این نرم افزار

این استارت‌آپ از مدلی استفاده می‌کند که روی نمونه‌های صوتی ضبط‌شده در استودیوی این شرکت در برلین، شهر محل فعالیت AI-coustics، آموزش دیده است. به افرادی که نمونه‌هایی را ضبط می‌کنند پول پرداخت می‌شود و سپس آن نمونه‌ها به مجموعه‌ای از داده‌ها اضافه می‌شوند تا مدل کاهش نویز AI-coustics آموزش ببیند.

سایپل گفت: «ما رویکرد منحصربه‌فردی را برای شبیه‌سازی مصنوعی صدا و مشکلات – مانند نویز، انعکاس، فشرده‌سازی، میکروفون‌های با محدوده باند، بریدگی و غیره – در طول فرآیند آموزش توسعه دادیم.»

من حدس می‌زنم که برخی با طرح پرداخت یک‌بار مصرف این برنامه برای تولیدکنندگان محتوا مخالف خواهند بود، زیرا مدلی که این استارت‌آپ در حال آموزش آن است، در درازمدت می‌تواند بسیار سودآور شود. اما شاید نگرانی بزرگ‌تر و فوری‌تر، سوگیری باشد.

مشکلات احتمالی AI coustics

به خوبی ثابت شده است که الگوریتم‌های تشخیص گفتار می‌توانند سوگیری‌هایی را ایجاد کنند. سوگیری‌هایی که در نهایت به کاربران آسیب می‌رسانند. مطالعه‌ای که در مجموعه مقالات آکادمی ملی علوم منتشر شد، نشان داد که تشخیص گفتار از شرکت‌های پیشرو، دو برابر بیشتر احتمال داشت که صدای افراد سیاه‌پوست را نسبت به افراد سفید اشتباه کند.

سایپل می‌گوید این هوشی مصنوعی برای مقابله با این مشکل، بر جذب مشارکت‌کنندگان نمونه‌های گفتار «متنوع» تمرکز می‌کند. او افزود: «حجم و تنوع برای از بین بردن سوگیری و کارکرد این فناوری برای تمام زبان‌ها، هویت‌های گویشور، سن، لهجه و جنسیت‌ها کلیدی است.

اهداف این هوش مصنوعی

سایپل پیش بینی می کند که از فناوری AI-coustics برای بهبود گفتار در زمان واقعی و ضبط شده استفاده شود، و شاید حتی در دستگاه هایی مانند ساندبارها، تلفن های هوشمند و هدفون ها برای افزایش خودکار وضوح صدا تعبیه شود.

در حال حاضر، AI-coustics یک برنامه وب و API برای پردازش ضبط های صوتی و تصویری و یک SDK ارائه می دهد که پلتفرم AI-coustics را به گردش کار، برنامه ها و سخت افزارهای موجود وارد می کند.