ویژگی جدید دوبله خودکار
  • ۱۴۰۳-۰۹-۲۱
  • مسعود حمداللهی
  • 0
اگه حوصله خوندن نداری میتونی این مقاله رو به صورت فایل صوتی هم گوش بدی 😉

یوتیوب روز سه‌شنبه اعلام کرد که ویژگی جدید دوبله خودکار این پلتفرم، که به سازندگان محتوا این امکان را می‌دهد تا صدا های ترجمه‌شده را برای ویدیوهای خود تولید کنند، اکنون در دسترس صدها هزار کانال دیگر قرار گرفته است. این قابلیت به کاربران کمک می‌کند تا محتوای خود را به زبان‌های مختلف ارائه دهند و به مخاطبان بیشتری دسترسی پیدا کنند.

یوتیوب برای اولین بار سال گذشته در رویداد ویدکان (Vidcon) ابزار دوبله خودکار مبتنی بر هوش مصنوعی خود را معرفی کرد که در آن زمان تنها با گروه محدودی از سازندگان محتوا در حال آزمایش بود. این ابزار می‌تواند به افزایش دسترسی و درک آسان‌تر محتوای موجود در این پلتفرم برای کاربران در سرتاسر جهان کمک کند.

ویژگی دوبله خودکار اکنون برای کانال‌هایی که بر محتوای آموزشی و اطلاعاتی تمرکز دارند، مانند ویدیوهایی که به بینندگان نحوه آشپزی یا خیاطی را آموزش می‌دهند، در دسترس قرار گرفته است. به زودی این قابلیت به انواع دیگر محتوا نیز گسترش خواهد یافت.

مطلب پیشنهادی: ۵ پرامپت هوش مصنوعی برای ساخت والپیپر

برای استفاده از این ویژگی، کافی است یک ویدیو را همانند قبل آپلود کنید. یوتیوب به‌طور خودکار زبان ویدیو را شناسایی کرده و نسخه‌های دوبله‌شده را به زبان‌های دیگر تولید می‌کند. این ابزار از زبان‌های انگلیسی، فرانسوی، آلمانی، هندی، اندونزیایی، ایتالیایی، ژاپنی، پرتغالی و اسپانیایی پشتیبانی می‌کند.

دوبله خودکار یوتیوب از قابلیت های Gemini گوگل برای تکرار گفتار انسان استفاده می کند. با این حال، این شرکت هشدار می دهد که این ویژگی ممکن است عملکرد کاملی نداشته باشد، زیرا این فناوری هنوز در مراحل اولیه توسعه خود است.

«ما به‌طور مداوم تلاش می‌کنیم تا دقت این ویژگی را به حداکثر برسانیم، اما ممکن است در برخی موارد ترجمه‌ها کاملاً صحیح نباشند یا صدای دوبله‌شده به‌طور دقیق بیانگر سخنران اصلی نباشد. ما واقعاً از صبر و بازخورد شما در حین ادامه پیشرفت‌های خود قدردانی می‌کنیم.» این جمله را Gemini در پست وبلاگ خود در روز سه‌شنبه منتشر کرد.

این شرکت همچنین به سازندگان یادآوری کرد که می‌توانند منتظر به‌روزرسانی آینده‌ای به نام «گفتار بیانی(Expressive Speech)» باشند. این ویژگی به‌منظور کمک به تکرار لحن، احساسات و حتی محیط اطراف سازنده طراحی شده است.

منبع: techcrunch

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *