با فراگیر شدن دیپفیکها، OpenAI در حال بهبود تکنولوژی شبیهسازی صدا است. اما این شرکت اصرار دارد که این کار را به طور مسئولانه انجام میدهد.
امروز، پیشنمایش اولیه موتور صوتی OpenAI، که توسعهای از API تبدیل متن به گفتار فعلی این شرکت است، انجام میشود. موتور صوتی که حدود دو سال در حال توسعه بوده است، به کاربران اجازه میدهد تا هر نمونه صدای 15 ثانیهای را برای تولید یک کپی مصنوعی از آن صدا بارگذاری کنند. اما هنوز هیچ تاریخی برای در دسترس بودن عموم اعلام نشده است. این موضوع به شرکت زمان میدهد تا ببیند چگونه از این مدل استفاده و سوءاستفاده میشود.
جف هریس، یکی از اعضای تیم محصول OpenAI در مصاحبهای با TechCrunch گفت: «ما میخواهیم مطمئن شویم که همه از نحوهی بهکارگیری آن احساس خوبی دارند. اینکه ما بفهمیم این فناوری در کجا خطرناک است و برای آن راهحلهایی داشته باشیم.»
هریس گفت: مدل هوش مصنوعی تولیدکننده که موتور صوتی را تقویت میکند، برای مدتی در معرض دید عموم بوده است.
این مدل همان مدلی است که زیربنای قابلیتهای صدا و «بلند خواندن» در چت جی پی تی، چتبات مبتنی بر هوش مصنوعی OpenAI، و همچنین صداهای از پیش تنظیم شده موجود در API تبدیل متن به گفتار OpenAI را تشکیل میدهد. و اسپاتیفای از اوایل سپتامبر از آن برای دوبله پادکست برای مجریان برجسته مانند لکس فرادمن به زبانهای مختلف استفاده میکند.
از هریس در پاسخ به این سوال فقط گفت که مدل موتور صوتی روی ترکیبی از دادههای مجوزدار و در دسترس عموم آموزش دیده است.
مدلهایی مانند مدلهایی که موتور صوتی را تقویت میکنند، روی تعداد زیادی از نمونهها آموزش داده میشوند که معمولاً از وبسایتهای عمومی و مجموعههای داده در سراسر وب به دست میآیند. بسیاری از فروشندگان هوش مصنوعی تولیدکننده، دادههای آموزشی را به عنوان یک مزیت رقابتی میبینند. به همین دلیل آن را و اطلاعات مربوط به آن را محرمانه نگه میدارند. اما جزئیات دادههای آموزشی همچنین میتوانند منبع بالقوهای برای دعاوی حقوقی مرتبط با مالکیت فکری باشند، که دلیل دیگری برای عدم افشای اطلاعات زیاد است.
OpenAI هماکنون به دلیل ادعای نقض قانون مالکیت فکری با آموزش هوش مصنوعی خود روی محتوای دارای حق نسخهبرداری، از جمله عکس، آثار هنری، کد، مقالات و کتابهای الکترونیکی، بدون ذکر اعتبار یا پرداخت به سازندگان یا مالکان، مورد شکایت قرار گرفته است.
OpenAI توافقنامههای لایسنس با برخی از ارائهدهندگان محتوا مانند Shutterstock و ناشر خبری Axel Springer دارد. و به مدیران وبسایت اجازه میدهد تا OpenAI را از اسکن وبسایتشان برای دادههای آموزشی مسدود کنند. OpenAI همچنین به هنرمندان اجازه میدهد تا از مجموعه دادههایی که این شرکت برای آموزش مدلهای تولیدکننده تصویر خود، از جمله آخرین مدل DALL-E 3 خود استفاده میکند، انصراف دهند و آثار خود را حذف کنند.
اما OpenAI چنین طرحی برای خروج از دیگر محصولات خود ارائه نمیدهد. و در بیانیه اخیر به مجلس اعیان بریتانیا، OpenAI پیشنهاد کرد که ایجاد مدلهای هوش مصنوعی مفید بدون مواد دارای حق نسخهبرداری «غیرممکن» است. این شرکت ادعا میکند که استفاده منصفانه از آنها در جایی که مربوط به آموزش مدل میشود، محافظت میکند.
حالت صوتی پیشرفته ChatGPT در وب OpenAI در حال گسترش قابلیت حالت صوتی پیشرفته (Advanced…
عینکهای واقعیت افزوده متا با قابلیتهای هوش مصنوعی خود متا اعلام کرد که شروع به…
بلواسکای از پستهای کاربران برای آموزش هوش مصنوعی خود استفاده نمیکند. بلواسکای، شبکه اجتماعی که…
قابلیت Genmoji اپل چیست؟ به روزرسانی iOS 18.1 اپل، مجموعه ای از ویژگیهای هوش مصنوعی…
کسب درآمد از اسپاتیفای Spotify روز چهارشنبه اعلام کرد که پادکسترهایی که ویدیوهای محبوب را…
ساخت ریمیکس با هوش مصنوعی یوتیوب سال گذشته، یوتیوب به برخی از سازندگان محتوا در…