استارتاپ فرانسوی AniML توسعه دهنده برنامه جدید اسکن سهبعدی به نام Doly، میخواهد چیزی شبیه به PhotoRoom برای ویدیوهای محصول بسازد.
اگر کفش ورزشی در یک بازار آنلاین میفروشید یا به تبلیغات اینستاگرام برای کالاهای خود نیاز دارید، Doly به شما کمک میکند تا با استفاده از تلفن خود مدلهای سهبعدی بسازید و آنها را به ویدیوهای محصول با ظاهری حرفهای تبدیل کنید.
ایجاد ویدیو کار سختی است، اما ایجاد مدل سهبعدی حتی سختتر است. به همین دلیل است که تیم AniML بر روی سادهسازی این تجربه تمرکز کرده است. آنها میخواهند اسکن سهبعدی را به یک فناوری رایج تبدیل کنند و این کار را با گنجاندن آن در یک برنامه آیفون شروع میکنند.
کار اسکن سهبعدی با Doly به این صورت است: کاربر دوربین گوشی خود را به سمت محصول میگیرد و برای اسکن سهبعدی آن به صورت فیزیکی در اطراف آن حرکت میکند. در پشت صحنه، برنامه تصاویر ثابت را میگیرد و آنها را به ابر ارسال میکند. AniML با استفاده از چیزی به نام Gaussian splatting یک خط لوله بازسازی ساخته است تا این تصاویر را به یک مدل سهبعدی واقعی تبدیل کند.
مدلهای سهبعدی به طور سنتی با مجموعهای از نقاط در فضای سهبعدی، برخی از بافتهای ۲ بعدی که روی این سطوح و افکتهای نورپردازی پیشبینی شدهاند، ایجاد میشوند. Gaussian splatting یک خط لوله رندر کاملاً جدید است که شامل تخمین ابر نقاط سهبعدی از یک مجموعه تصاویر ۲ بعدی با استفاده از یک مدل هوش مصنوعی از پیش آموزشدیده است.
Rémi Rousseau، مدیرعامل و همبنیانگذار AniML به TechCrunch گفت:
“نقطه شروع ما یک یافته تکنولوژیکی بود: هوش مصنوعی به تازگی به دنیای سهبعدی رسیده بود. بنابراین افراد در فیسبوک، اما حتی بیشتر در گوگل، در حال تحقیق بودند و یک مقاله تحقیقاتی نسبتاً مهم در مورد چیزی به نام NeRF نوشتند. این یک پارادایم جدید است که در آن شما سعی میکنید سهبعدی را با استفاده از یادگیری ماشین بازسازی کنید.”
او افزود:
“شما دیگر با سهبعدی مبتنی بر چندضلعی کار نمیکنید، بلکه اکنون در سهبعدی مبتنی بر عصب هستید.”
Rousseau میگوید Gaussian splatting دقیقاً مشابه NeRF نیست، اما نوعی فناوری مدلسازی سهبعدی نسل بعدی است.
این بخش فنی ماجرا بود. سپس AniML بر روی یافتن مورد استفادهای تمرکز کرد که میتوانست از روز اول کاربران را جذب کند. شرکتهای تجارت الکترونیک انتخاب واضحی برای ابزار ایجاد مدلهای سهبعدی بودند.
اما این برنامه چه چیز دیگری ارائه میدهد؟ پس از اسکن یک مدل سهبعدی، کاربران Doly میتوانند قالب انتخاب کنند تا یک صحنه سهبعدی را برای شیء خود که قرار است در آن ادغام شود، انتخاب کنند. این میتواند یک چرخش ساده سهبعدی با یک پیشزمینه ساده یا چیزی نمایشیتر از نظر صحنهپردازی بازاریابی باشد، مانند نزدیک شدن آهسته دوربین به شیء و تغییر به زوایای مختلف.
اگر مشتری نتیجه را دوست داشته باشد، میتواند ویدیو را از برنامه خریداری کند و برای استفاده در جای دیگر دانلود کند.
حالت صوتی پیشرفته ChatGPT در وب OpenAI در حال گسترش قابلیت حالت صوتی پیشرفته (Advanced…
عینکهای واقعیت افزوده متا با قابلیتهای هوش مصنوعی خود متا اعلام کرد که شروع به…
بلواسکای از پستهای کاربران برای آموزش هوش مصنوعی خود استفاده نمیکند. بلواسکای، شبکه اجتماعی که…
قابلیت Genmoji اپل چیست؟ به روزرسانی iOS 18.1 اپل، مجموعه ای از ویژگیهای هوش مصنوعی…
کسب درآمد از اسپاتیفای Spotify روز چهارشنبه اعلام کرد که پادکسترهایی که ویدیوهای محبوب را…
ساخت ریمیکس با هوش مصنوعی یوتیوب سال گذشته، یوتیوب به برخی از سازندگان محتوا در…