Web Analytics Made Easy - Statcounter
به نقل از «پول نیوز»
2024-04-29@19:15:29 GMT

ربات جدید مایکروسافت با قابلیت بیان احساسات

تاریخ انتشار: ۲۲ دی ۱۴۰۱ | کد خبر: ۳۶۸۲۵۸۷۰

ربات جدید مایکروسافت با قابلیت بیان احساسات

ربات هوش مصنوعی جدید تبدیل متن به صدای شرکت مایکروسافت موسوم به VALL-E تنها با ۳ ثانیه گوش سپردن به صدای شخص می‌تواند آن را به خوبی تقلید کند و حتی می‌تواند احساسات گوینده را نیز حفظ کند.

مایکروسافت جدیدترین پژوهش‌های خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که می‌تواند صدای افراد را تنها از یک نمونه صوتی سه ثانیه‌ای شبیه‌سازی کند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!



پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کرده‌اند که می‌تواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.

گفتار نه تنها می‌تواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.

مایکروسافت می‌گوید، روزی می‌توان از این ربات برای برنامه‌های کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپ‌فیک (جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.

ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک» (neural codec language model) می‌نامد که از شبکه فشرده‌سازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونه‌های کوتاه از بلندگوی هدف تولید می‌کند.

پژوهشگران در مقاله‌ای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح داده‌اند. صدایی که این ربات سعی می‌کند تقلید کند باید با صدای داده‌های آموزشی مطابقت داشته باشد.

این گروه دقیقاً نشان می‌دهد که این کار توسط VALL-E چقدر خوب انجام می‌شود؛ بنابراین برای هر عبارتی که می‌خواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیه‌ای از گوینده برای تقلید کافی است.

البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آن‌ها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.

این واقعیت که VALL-E لحن احساسی نمونه‌های اصلی را حفظ می‌کند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر می‌رسد که از همان مکان آمده است.

کار Vall-E در تقلید لهجه‌ها نیز بسیار خوب است و حداقل لهجه‌های آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید می‌کند.

مایکروسافت برای بهبود این مدل قصد دارد داده‌های آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راه‌هایی برای کاهش کلماتی است که نامفهوم یا فراموش شده‌اند.

پیامد‌های این نوع فناوری کاملاً واضح است. از جنبه مثبت می‌توان این گونه در نظر گرفت که کاربران می‌توانند از این ربات بخواهند مثلا لیست خرید آن‌ها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، می‌توان با استفاده از این فناوری و جلوه‌های ویژه پروژه را پایان رساند.

اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشه‌ها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمی‌توان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.

پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، می‌تواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن می‌توان هر دستگاه امنیتی تشخیص صدا را دور زد.

مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که می‌تواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبع‌باز قرار نداده است، چرا که از آنجایی که VALL-E می‌تواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوه‌ای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.

این الگوریتم جدید نمونه‌ای از بسیاری از الگوریتم‌های هوش مصنوعی است که می‌تواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آن‌ها را بازگو نکرده است.

ظهور هوش مصنوعی‌های خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتم‌های دیپ‌فیک مختلف و تعداد بی‌شماری از الگوریتم‌های دیگر به نظر می‌رسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاه‌ها و ورود به دنیای واقعی کرده است. این فناوری‌ها نیز مانند همه تغییرات دیگر، فرصت‌ها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی می‌کنیم.

منبع: پول نیوز

کلیدواژه: مایکروسافت پژوهش صدای افراد نمونه صوتی هوش مصنوعی تبدیل متن هوش مصنوعی

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت www.poolnews.ir دریافت کرده‌است، لذا منبع این خبر، وبسایت «پول نیوز» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۶۸۲۵۸۷۰ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

پای ربات‌ها به پمپ بنزین رسید

 به گزارش تابناک، ایسنا نوشت: امارات متحده عربی در حال استقرار بازوهای رباتیک در پمپ‌های بنزین خود برای رباتیک کردن روند سوختگیری است. به لطف این بازوهای رباتیک، بیش از ۲۰ میلیون نفر سوخت بهتر و سریع‌تری را برای خودروهای خود دریافت می‌کنند.

شرکت ملی نفت ابوظبی جدیدترین نوآوری خود را معرفی کرد. بازوی رباتیکی که دریچه بنزین خودرو را باز، درپوش آن را جدا و باک را به شکل دقیق و آسان پر می‌کند.

این بازوی رباتیک نه تنها باک خودرو را پر می‌کند، بلکه به لطف بهره‌گیری از یک برنامه در وقت افراد نیز صرفه‌جویی می‌کند. این برنامه تضمین می‌کند که دقیقاً مقدار سوخت مورد نیاز خود را دریافت می‌کنید.

توسعه این بازوی رباتیک بیش از یک سال به طول انجامیده است. این سیستم نه تنها سریع است، بلکه برای سازگار بودن با محیط زیست و به حداقل رساندن خطرات نشت سوخت ایجاد شده است.

این بازوی رباتیک چطور کار می‌کند؟

وقتی به یکی از پمپ‌های بنزین ADNOC که به این فناوری مجهز هستند، می‌رسید، نوع سوخت خود را انتخاب می‌کنید و روی صفحه لمسی یا برنامه مخصوص آن روی گوشی هوشمند خود انتخاب می‌کنید.

سپس یک بازوی رباتیک با یک نازل و حسگرهای مناسب اطمینان حاصل می‌کند که نازل هنگام پمپاژ سوخت به درستی تراز شده است. دوربین‌ها و حسگرها بر این فرآیند نظارت می‌کنند و در عین حال اطمینان می‌دهند که همه چیز به درستی و ایمن انجام می‌شود.

سرانجام هنگامی که سوخت‌رسانی به پایان می‌رسد، بازوی رباتیک نازل را عقب می‌کشد و با بستن درب باک و دریچه سوخت، راننده را راهی می‌کند.

توسعه این بازوی رباتیک بخشی از یک استراتژی پنج ساله است تا اطمینان حاصل شود که خودروها به درستی سوختگیری می‌کنند.

این فناوری همچنین به عنوان مثال بهره‌وری کارگران را افزایش می‌دهد که به معنای صرف کردن ساعات کمتری در فضای باز در گرما و سرماست. ضمن اینکه برای مشتریان نیز این به معنای انتظار کمتر است.

به گفته مسئولان اماراتی، این فناوری برای اولین بار در خاورمیانه و برای نخستین بار در آب و هوای گرم تابستان آزمایش شده و این گام رو به جلو نشان دهنده تعهد تزلزل ناپذیر ما به تعالی خدمات است. این فناوری برای پشتیبانی از کارکنان موجود، افزایش بهره‌وری آنها و کاهش زمان انتظار مشتریان استفاده خواهد شد.

در حال حاضر یک پروژه آزمایشی در ابوظبی در حال انجام است. هدف آن نیز جمع‌آوری داده‌ها و اطلاعات است. سپس از این داده‌ها برای فعال کردن فناوری بازوی رباتیک در سراسر شبکه سوخت رسانی در امارات متحده عربی استفاده می‌شود.

اماراتی‌ها همچنین اولین تجربه شخصی سازی شده با هوش مصنوعی در منطقه را برای سوخت‌گیری توسعه داده‌اند. به لطف این برنامه، دوربین‌های هوشمند، خودرو را شناسایی و بررسی می‌کنند و صفحه‌های دیجیتال، راننده را برای سوخت‌گیری هدایت می‌کنند. همه این کارها را می‌توان به راحتی از همان پشت فرمان انجام داد و نیازی به ترک خودرو نیست.

مسائل مربوط به سوخت رسانی می‌تواند شامل چالش‌های مختلفی باشد، مانند اینکه سطح بالای ترافیک می‌تواند منجر به زمان انتظار طولانی در پمپ‌های بنزین شود. بنابراین پیاده‌سازی فناوری‌های جدید مانند این بازوی رباتیک می‌تواند کارایی را افزایش دهد و در عین حال نگرانی‌های ایمنی را برطرف و رضایت مشتری را فراهم کند.

اماراتی‌ها انتظار دارند این بازوی رباتیک تا پایان سال به طور کامل عملیاتی شود. این فناوری قرار است در بیش از ۵۰۰ پمپ بنزین مستقر شود و به بیش از ۲۰ میلیون نفر خدمات‌رسانی کند.

دیگر خبرها

  • پاسخ آیت الله نوری همدانی به سوالی درباره طرح عفاف و حجاب پلیس (طرح نور)
  • حمایت کامل یک مرجع تقلید از «طرح نور»: امری مبارک است | درباره حجاب به شدت حساسیم
  • اگر از زندگی خسته و کلافه شده‌اید بخوانید
  • پای ربات‌ها به پمپ بنزین رسید
  • این اولین ربات انسان‌نمای تمام‌الکتریکی با سرعت ۶ کیلومتربرساعت است
  • کدام مرجع تقلید بر پیکر عروس امام ( ره) اقامه نماز کرد؟ +عکس
  • نسل جدید ربات انسان‌نما، همه‌منظوره است
  • (ویدیو) ربات چری در راه ایران
  • ربات هوشمند خودروسازی چینی چری رونمایی شد
  • (ویدئو) این ربات سرطان ریه را تشخیص می‌دهد