ربات جدید مایکروسافت با قابلیت بیان احساسات
تاریخ انتشار: ۲۲ دی ۱۴۰۱ | کد خبر: ۳۶۸۲۵۸۷۰
ربات هوش مصنوعی جدید تبدیل متن به صدای شرکت مایکروسافت موسوم به VALL-E تنها با ۳ ثانیه گوش سپردن به صدای شخص میتواند آن را به خوبی تقلید کند و حتی میتواند احساسات گوینده را نیز حفظ کند.
مایکروسافت جدیدترین پژوهشهای خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که میتواند صدای افراد را تنها از یک نمونه صوتی سه ثانیهای شبیهسازی کند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کردهاند که میتواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.
گفتار نه تنها میتواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.
مایکروسافت میگوید، روزی میتوان از این ربات برای برنامههای کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپفیک (جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.
ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک» (neural codec language model) مینامد که از شبکه فشردهسازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونههای کوتاه از بلندگوی هدف تولید میکند.
پژوهشگران در مقالهای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح دادهاند. صدایی که این ربات سعی میکند تقلید کند باید با صدای دادههای آموزشی مطابقت داشته باشد.
این گروه دقیقاً نشان میدهد که این کار توسط VALL-E چقدر خوب انجام میشود؛ بنابراین برای هر عبارتی که میخواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیهای از گوینده برای تقلید کافی است.
البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آنها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.
این واقعیت که VALL-E لحن احساسی نمونههای اصلی را حفظ میکند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر میرسد که از همان مکان آمده است.
کار Vall-E در تقلید لهجهها نیز بسیار خوب است و حداقل لهجههای آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید میکند.
مایکروسافت برای بهبود این مدل قصد دارد دادههای آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راههایی برای کاهش کلماتی است که نامفهوم یا فراموش شدهاند.
پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت میتوان این گونه در نظر گرفت که کاربران میتوانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، میتوان با استفاده از این فناوری و جلوههای ویژه پروژه را پایان رساند.
اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشهها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمیتوان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.
پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، میتواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن میتوان هر دستگاه امنیتی تشخیص صدا را دور زد.
مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که میتواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبعباز قرار نداده است، چرا که از آنجایی که VALL-E میتواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوهای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.
این الگوریتم جدید نمونهای از بسیاری از الگوریتمهای هوش مصنوعی است که میتواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آنها را بازگو نکرده است.
ظهور هوش مصنوعیهای خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتمهای دیپفیک مختلف و تعداد بیشماری از الگوریتمهای دیگر به نظر میرسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاهها و ورود به دنیای واقعی کرده است. این فناوریها نیز مانند همه تغییرات دیگر، فرصتها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی میکنیم.
منبع: پول نیوز
کلیدواژه: مایکروسافت پژوهش صدای افراد نمونه صوتی هوش مصنوعی تبدیل متن هوش مصنوعی
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.poolnews.ir دریافت کردهاست، لذا منبع این خبر، وبسایت «پول نیوز» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۶۸۲۵۸۷۰ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
پای رباتها به پمپ بنزین رسید
به گزارش تابناک، ایسنا نوشت: امارات متحده عربی در حال استقرار بازوهای رباتیک در پمپهای بنزین خود برای رباتیک کردن روند سوختگیری است. به لطف این بازوهای رباتیک، بیش از ۲۰ میلیون نفر سوخت بهتر و سریعتری را برای خودروهای خود دریافت میکنند.
شرکت ملی نفت ابوظبی جدیدترین نوآوری خود را معرفی کرد. بازوی رباتیکی که دریچه بنزین خودرو را باز، درپوش آن را جدا و باک را به شکل دقیق و آسان پر میکند.
این بازوی رباتیک نه تنها باک خودرو را پر میکند، بلکه به لطف بهرهگیری از یک برنامه در وقت افراد نیز صرفهجویی میکند. این برنامه تضمین میکند که دقیقاً مقدار سوخت مورد نیاز خود را دریافت میکنید.
توسعه این بازوی رباتیک بیش از یک سال به طول انجامیده است. این سیستم نه تنها سریع است، بلکه برای سازگار بودن با محیط زیست و به حداقل رساندن خطرات نشت سوخت ایجاد شده است.
این بازوی رباتیک چطور کار میکند؟
وقتی به یکی از پمپهای بنزین ADNOC که به این فناوری مجهز هستند، میرسید، نوع سوخت خود را انتخاب میکنید و روی صفحه لمسی یا برنامه مخصوص آن روی گوشی هوشمند خود انتخاب میکنید.
سپس یک بازوی رباتیک با یک نازل و حسگرهای مناسب اطمینان حاصل میکند که نازل هنگام پمپاژ سوخت به درستی تراز شده است. دوربینها و حسگرها بر این فرآیند نظارت میکنند و در عین حال اطمینان میدهند که همه چیز به درستی و ایمن انجام میشود.
سرانجام هنگامی که سوخترسانی به پایان میرسد، بازوی رباتیک نازل را عقب میکشد و با بستن درب باک و دریچه سوخت، راننده را راهی میکند.
توسعه این بازوی رباتیک بخشی از یک استراتژی پنج ساله است تا اطمینان حاصل شود که خودروها به درستی سوختگیری میکنند.
این فناوری همچنین به عنوان مثال بهرهوری کارگران را افزایش میدهد که به معنای صرف کردن ساعات کمتری در فضای باز در گرما و سرماست. ضمن اینکه برای مشتریان نیز این به معنای انتظار کمتر است.
به گفته مسئولان اماراتی، این فناوری برای اولین بار در خاورمیانه و برای نخستین بار در آب و هوای گرم تابستان آزمایش شده و این گام رو به جلو نشان دهنده تعهد تزلزل ناپذیر ما به تعالی خدمات است. این فناوری برای پشتیبانی از کارکنان موجود، افزایش بهرهوری آنها و کاهش زمان انتظار مشتریان استفاده خواهد شد.
در حال حاضر یک پروژه آزمایشی در ابوظبی در حال انجام است. هدف آن نیز جمعآوری دادهها و اطلاعات است. سپس از این دادهها برای فعال کردن فناوری بازوی رباتیک در سراسر شبکه سوخت رسانی در امارات متحده عربی استفاده میشود.
اماراتیها همچنین اولین تجربه شخصی سازی شده با هوش مصنوعی در منطقه را برای سوختگیری توسعه دادهاند. به لطف این برنامه، دوربینهای هوشمند، خودرو را شناسایی و بررسی میکنند و صفحههای دیجیتال، راننده را برای سوختگیری هدایت میکنند. همه این کارها را میتوان به راحتی از همان پشت فرمان انجام داد و نیازی به ترک خودرو نیست.
مسائل مربوط به سوخت رسانی میتواند شامل چالشهای مختلفی باشد، مانند اینکه سطح بالای ترافیک میتواند منجر به زمان انتظار طولانی در پمپهای بنزین شود. بنابراین پیادهسازی فناوریهای جدید مانند این بازوی رباتیک میتواند کارایی را افزایش دهد و در عین حال نگرانیهای ایمنی را برطرف و رضایت مشتری را فراهم کند.
اماراتیها انتظار دارند این بازوی رباتیک تا پایان سال به طور کامل عملیاتی شود. این فناوری قرار است در بیش از ۵۰۰ پمپ بنزین مستقر شود و به بیش از ۲۰ میلیون نفر خدماترسانی کند.