کد خبر: 131420
ف
ربات جدید مایکروسافت با قابلیت بیان احساسات
ربات هوش مصنوعی جدید تبدیل متن به صدای شرکت مایکروسافت موسوم به VALL-E تنها با ۳ ثانیه گوش سپردن به صدای شخص می‌تواند آن را به خوبی تقلید کند و حتی می‌تواند احساسات گوینده را نیز حفظ کند.

به گزارش ثریا مایکروسافت جدیدترین پژوهش‌های خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که می‌تواند صدای افراد را تنها از یک نمونه صوتی سه ثانیه‌ای شبیه‌سازی کند.

پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کرده‌اند که می‌تواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.

گفتار نه تنها می‌تواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.

مایکروسافت می‌گوید، روزی می‌توان از این ربات برای برنامه‌های کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپ‌فیک(جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.

ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک»(neural codec language model) می‌نامد که از شبکه فشرده‌سازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونه‌های کوتاه از بلندگوی هدف تولید می‌کند.

پژوهشگران در مقاله‌ای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح داده‌اند. صدایی که این ربات سعی می‌کند تقلید کند باید با صدای داده‌های آموزشی مطابقت داشته باشد.

این گروه دقیقاً نشان می‌دهد که این کار توسط VALL-E  چقدر خوب انجام می‌شود. بنابراین برای هر عبارتی که می‌خواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیه‌ای از گوینده برای تقلید کافی است.

البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آنها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.

این واقعیت که VALL-E  لحن احساسی نمونه‌های اصلی را حفظ می‌کند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر می‌رسد که از همان مکان آمده است.

کار Vall-E در تقلید لهجه‌ها نیز بسیار خوب است و حداقل لهجه‌های آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید می‌کند.

مایکروسافت برای بهبود این مدل قصد دارد داده‌های آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راه‌هایی برای کاهش کلماتی است که نامفهوم یا فراموش شده‌اند.

پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت می‌توان این گونه در نظر گرفت که کاربران می‌توانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، می‌توان با استفاده از این فناوری و جلوه‌های ویژه پروژه را پایان رساند.

اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشه‌ها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمی‌توان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.

پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، می‌تواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن می‌توان هر دستگاه امنیتی تشخیص صدا را دور زد.

مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که می‌تواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبع‌باز قرار نداده است، چرا که از آنجایی که VALL-E می‌تواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوه‌ای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.

این الگوریتم جدید نمونه‌ای از بسیاری از الگوریتم‌های هوش مصنوعی است که می‌تواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آنها را بازگو نکرده است.

ظهور هوش مصنوعی‌های خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتم‌های دیپ‌فیک مختلف و تعداد بی‌شماری از الگوریتم‌های دیگر به نظر می‌رسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاه‌ها و ورود به دنیای واقعی کرده است. این فناوری‌ها نیز مانند همه تغییرات دیگر، فرصت‌ها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی می‌کنیم.

منبع: خبرگزاری ایسنا


مرتبط ها
ارسال نظر
chapta
حداکثر تعداد کاراکتر نظر 200 ميياشد .
نظراتی که حاوی توهین یا افترا به اشخاص ،قومیت ها ،عقاید دیگران باشد و یا با قوانین کشور وآموزه های دینی مغایرت داشته باشد منتشر نخواهد شد - لطفاً نظرات خود را با حروف فارسی تایپ کنید.

چین لباس‌های فضایی جدیدی را به ایستگاه فضایی تیانگونگ فرستاد

چرا لاک‌پشت‌ها در برابر سرطان مصون هستند؟

ضرورت تلاش همه‌جانبه برای حضور ایمن و پرشور دانش‌آموزان و فرهنگیان در سفر تمدن‌ساز اربعین

طرح حامی گامی راهبردی در مسیر قطع چرخه فقر آموزشی است

اعزام ۸ تیم المپیادی‌ به رقابت‌های جهانی از ۲۶ تیر تا ۲۰ مرداد/ کارشکنی فرانسه برای جلوگیری از درخشش دانش‌آموزان ایرانی در المپیاد فیزیک

عذرخواهی شرکت ایلان ماسک به‌خاطر گراک

مقابله با سارقان محتوا در فیس‌بوک و اینستاگرام

مالک تیک‌تاک عینک واقعیت ترکیبی می‌سازد

عطش تراشه‌ساز آمریکایی برای حضور در بازار چین

ارزیابی تکمیلی داوطلبان اعزام به مدارس از کشور / انتخاب ۴۷۰ نفر جهت اعزام

کاوشگر ناسا رکورد شکست

هوش مصنوعی کلود طراح شد!

خاورمیانه برای پذیرش هوش مصنوعی آماده است؟

کمبود بودجه به ناسا رسید؛ خروج ۲هزار مدیر!

برای خواندن دست اپل از سامسونگ چشم برندارید!

ببینید؛ رونمایی از سریع‌ترین قطار چین با سرعت ۶۰۰ کیلومتر بر ساعت

جنگ سایه‌ها؛ چگونه اختلال در GPS زندگی روزمره ایرانیان را مختل کرد؟

جراحی کیسه صفرای خوک با روبات هوشمند

دسترسی به دامنه‌های .ir دچار مشکل شد

هفت تغییر مهم که در آیفون ۱۷ خواهیم دید

ساخت مخازن سبک و ایمن هیدروژن مایع با نانوصفحات گرافنی

حجم مغز افراد روان‌آزار کمتر است

روبات‌ها سربازان روسی را اسیر کردند

نقشه راه جدید دانشگاه شهید بهشتی برای همکاری گسترده با صنعت

ماموریت آکس-۴ ایستگاه فضایی بین‌المللی را ترک کرد

نحوه محاسبه نمره نهایی در پذیرش دانشجو معلمان چگونه است؟

بودجه دانشگاه آزاد زیر ذره‌بین؛ تاکید بر پایداری اقتصادی

یک ماده خنک‌کننده جدید توسط هوش مصنوعی کشف شد

هوش مصنوعی؛ شریک آینده‌نگر مدیریت بحران‌های جهانی

عکس روز ناسا از یک فرورفتگی در مریخ

غم اگر تصویر بود: نفس دختر ۲ ساله شهید حمید آزکات

تصویر/ دختر بچه‌ اهل غزه که به دلیل وحشت و ترس موهای سرش ریخته است

المپیاد فناورانه امیرکبیر؛ گامی برای تقویت ورزش دانشجویی

واکنش وزارت ارتباطات به اختلال مسیریاب‌ها؛ ملاحظات استفاده از واتس اپ

معاون وزیر علوم به سوالات کنکوری‌ها در تلویزیون جواب می‌دهد

سهم ۶۰ درصدی تاثیر سوابق تحصیلی در کنکور

از چت‌بات‌های هوش مصنوعی برای روان‌درمانی استفاده نکنید!

غصه شنبه از نظر علمی ثابت شد!

جایگزینی یک تزریق هفتگی با قرص‌ها برای بیماران پارکینسون

کشف ارتباط ساعت داخلی بدن و وعده‌های غذایی با خطر چاقی و دیابت

اروپا با طرحی بلندپروازانه، انقلاب کوانتومی خود را کلید می‌زند

پاکسازی موفق چاه نفت با فناوری نوین در شرکت‌های دانش‌بنیان دانشگاه شیراز

ستاد پیگیری و پشتیبانی از آسیب دیدگان جنگ تحمیلی در وزارت علوم تشکیل می‌شود

اعمال ۴۰ درصدی نمره کنکور در پذیرش نهایی دانشجو در سال ۱۴۰۴

زمان اعلام نتیجه اولیه و نهایی کنکور ۱۴۰۴ مشخص شد

آمادگی بانک سپه برای پرداخت تسهیلات ازدواج و فرزند‌آوری

معرفی جوان‌ترین و مسن‌ترین داوطلبان نوبت دوم کنکور

چهارشنبه، آخرین مهلت دریافت کارت کنکور/داوطلبان برای تغییر حوزه و گروه به باجه‌ها مراجعه نکنند

راه‌اندازی سامانه یادگیری مجازی برای توانمندسازی معلمان/ برگزاری دوره‌های تلفیقی حضوری و مجازی توانمندسازی

۱۵ درصد داوطلبان کنکور از استان تهران هستند/برگزاری آزمون در ۱۵ حوزه خارجی

رونمایی از هویت بصری جدید پنجره واحد خدمات الکترونیک آموزش و پرورش مای مدیوو توسعه قابلیت‌های نوین

میدان پویا؛ برنامه‌ای جدید برای تقویت اوقات فراغت تابستانی دانش‌آموزان

امکان ساخت رگ‌های خونی جدید در بدن با کمک نانوسیلیکات

هوش مصنوعی در دولت‌ها؛ ابزار پیشرفت یا تهدیدی برای دموکراسی؟

تولد اولین گاومیش شبیه‌سازی‌شده جهان از طریق سزارین

تولید کرم‌های نانویی ضد آفتاب و مرطوب کننده با جذب سریع

عینک نوردرمانی راهی برای شناخت سالمندان در مراحل ابتدایی آلزایمر عینک نوردرمانی راهی برای شناخت سالمندان در مراحل ابتدایی آلزایمر

عکس روز ناسا از کهکشان هلیکس

گرد و غبار و فرونشست زمین‌شناسی دو چالش مهم اصفهان

نزدیک ترین تصاویر از سطح خورشید منتشر شد

آیا ورزش واقعاً سلامت روان را بهبود می‌بخشد؟

فنی اما ساده: تکلیف ضایعات داخل توالت‌های هواپیما چه می‌شود؟

معرفی نسخه جدید شاسی‌بلند وارداتی ایران

پایان مزاحمت ماهواره‌ها برای اخترشناسان

محققان از فواید سلامت شگفت‌انگیز هندوانه پرده برداشتند

روبات پوشیدنی در شرکت هواپیمایی کره استخدام شد

فراخوان ساخت محصول افشانه سلولی برای ترمیم زخم‌های پوستی

زنبورهای عسل جاسوس چین شدند

سرعت بخشی به برنامه‌های پروژه ملی مهر

چت‌جی‌پی‌تی فارسی؛ ابزار بومی برای تولید محتوا و تحلیل هوشمند فروشگاه‌های اینترنتی

آسیب نور شهرهای بزرگ به سلامت قلب

هوش مصنوعی اوپن ای‌آی قهرمان شد

هوش مصنوعی به زودی با حیوانات خانگی حرف می‌زند

فیل‌ها با حرکات خود، خواسته‌هایشان را بیان می‌کنند

نشست بررسی ملاحظات پدافند غیرعامل در برنامه‌‏ریزی شهری برگزار می‌شود

نانوپوششی که ماهواره‌ها را در آسمان نامرئی می‌کند

کشفی که مسیر ساخت مواد رساناتر را هموار می‌کند

صرفه‌جویی ۹۹ درصدی در مصرف انرژی با فتوکاتالیست‌های نقاط‌کوانتومی

عکس روز ناسا از سحابی مورچه

رنگ‌های مدل پایه آیفون ۱۷ لو رفت

شعری زیبا/می‌شود من هم برایت شعر «ای ایران» بخوانم؟

پیام تسلیت دبیر شورای عالی انقلاب فرهنگی در پی ارتحال حجت‌الاسلام والمسلمین دکتر سید محمدباقر حجتی

تصویر/ دختر بچه‌ اهل غزه که به دلیل وحشت و ترس موهای سرش ریخته است

غم اگر تصویر بود: نفس دختر ۲ ساله شهید حمید آزکات

«مرگ مغزی جامعه شناسی ایرانی» بررسی می‌شود

تغییر قبله به سمت کعبه معظمه برای دشمنان اسلام شکننده بود

تصویر/ کتابت قرآن در مدت کمتر از ۳ سال توسط یک کودک هندی

منابع تاریخی که به وجود حضرت رقیه (س) و اتفاقات شام اشاره می‌کنند

کودک اهل کتاب ایرانی، آینده‌ساز گفت‌وگو و دانایی است

اگر دلتان یک مجموعه شعر می‌خواهد «باران کبوتر» منتشر شد

شرکت ۳۵۰۰ نفر در پویش قرآنی «به نام پیروزی»

نگاهی به مراحل هفت گانه سلوک تا شهود عرفانی در پرتو مقاومت عرفانی

تصویر/ هیئات با پیوند «ایده، شعر و اجرا» از مکتب حسین به ایران حسین پل زدند

شروط قرآن برای پیروزی یک جامعه در برابر توطئه‌های دشمن

روایت خواندنی سردبیر تهران تایمز از روزنامه‌نگاری در جنگ

نویسنده زن سودانی جایزه قلم پینتر ۲۰۲۵ را گرفت

همگرایی اسلامیت و ایرانیت پشتوانه هویتی و فرهنگی ایران عزیز

بازسازی اعتماد به چیزی فراتر از تبلیغات و رسانه نیاز دارد

منوی عجیب یک پیتزافروشی در نیاوران تهران که پربازدید شد

درمان ساده‌ای که می‌تواند از ۷۵ درصد سرطان‌های معده جلوگیری کند

در معرض ابتلا به آلزایمر هستید؟/ چهار مسیر منتهی به این بیماری را بشناسید

احتمال تغییر زمان امتحانات گواهینامه و ارتقا برای برخی دستیاران پزشکی

.ترفند رسانه‌ای رژیم صهیونیستی برای توجیه تجاوز نظامی به ایران

میراث شهید طهرانچی: تحول در جذب و ارتقای استادان

انقلاب انویدیا در هوش مصنوعی با پاسخ‌دهی ۳۲ برابر سریع‌تر به کاربران

استفاده از نانوحباب برای مهار گازهای گلخانه‌ای

برگزاری ۱۱ آزمون‌ گروه علوم پزشکی در مردادماه امسال

یافته‌های دانشمند ایرانی درباره توانایی چت‌جی‌پی‌تی در درک رنگ‌ها

ابتکار دانشمند ایرانی در استفاده از چوب برای افزایش طول عمر باتری‌

یک‌پنجم سال زیر تیغ فرابنفش؛ ازون از ما محافظت می‌کند ولی نه همیشه