
به گزارش ثریا مایکروسافت جدیدترین پژوهشهای خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که میتواند صدای افراد را تنها از یک نمونه صوتی سه ثانیهای شبیهسازی کند.
پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کردهاند که میتواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.
گفتار نه تنها میتواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.
مایکروسافت میگوید، روزی میتوان از این ربات برای برنامههای کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپفیک(جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.
ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک»(neural codec language model) مینامد که از شبکه فشردهسازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونههای کوتاه از بلندگوی هدف تولید میکند.
پژوهشگران در مقالهای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح دادهاند. صدایی که این ربات سعی میکند تقلید کند باید با صدای دادههای آموزشی مطابقت داشته باشد.
این گروه دقیقاً نشان میدهد که این کار توسط VALL-E چقدر خوب انجام میشود. بنابراین برای هر عبارتی که میخواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیهای از گوینده برای تقلید کافی است.
البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آنها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.
این واقعیت که VALL-E لحن احساسی نمونههای اصلی را حفظ میکند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر میرسد که از همان مکان آمده است.
کار Vall-E در تقلید لهجهها نیز بسیار خوب است و حداقل لهجههای آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید میکند.
مایکروسافت برای بهبود این مدل قصد دارد دادههای آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راههایی برای کاهش کلماتی است که نامفهوم یا فراموش شدهاند.
پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت میتوان این گونه در نظر گرفت که کاربران میتوانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، میتوان با استفاده از این فناوری و جلوههای ویژه پروژه را پایان رساند.
اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشهها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمیتوان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.
پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، میتواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن میتوان هر دستگاه امنیتی تشخیص صدا را دور زد.
مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که میتواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبعباز قرار نداده است، چرا که از آنجایی که VALL-E میتواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوهای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.
این الگوریتم جدید نمونهای از بسیاری از الگوریتمهای هوش مصنوعی است که میتواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آنها را بازگو نکرده است.
ظهور هوش مصنوعیهای خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتمهای دیپفیک مختلف و تعداد بیشماری از الگوریتمهای دیگر به نظر میرسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاهها و ورود به دنیای واقعی کرده است. این فناوریها نیز مانند همه تغییرات دیگر، فرصتها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی میکنیم.
منبع: خبرگزاری ایسنا
مصاحبههای دکتری دانشگاه آزاد از فردا شروع میشود
زمان بندی جدید اعتبارسنجی دانشگاههای خارج از کشور اعلام شد
آغاز ثبت درخواست مهمانی دانشجویان علمی کاربردی برای تابستان از ۲۱ تیر
انتشار تقویم آموزشی نیمسال اول و دومسال تحصیلی جدید دانشگاه شریف
جزئیات تازه درباره دریافت نحوه دریافت کارت نوبت دوم آزمون سراسری ۱۴۰۴
تحلیل ابعاد معنوی و عملی «طهارت» انسانی در پرتو قرآن و اهل بیت (ع)
استقبال دانشگاه تهران از دهه دوم محرم با مراسم «از دانشگاه تا کربلا»
خداوند خود توبه را به گناهکاران پیشنهاد میکند؛ گناهانی که حسنه می شوند
جزئیات پذیرش کاردانی فنیحرفهای اعلام شد
ردیف استخدامی ۳۳۹ نفر از متقاضیان جذب تعیین تکلیف شد
فراخوان جذب هیئت علمی دانشگاه آزاد درحال نهایی شدن
حبابهای یخ به پیامرسانهای جدید بدل شدند!
تاثیر جالب توجه ممنوعیت گردش به چپ بر حجم ترافیک
تهیه نقشه راه ملی فناوری کوانتومی با همکاری دستگاهها
جکوزی یا سونا، کدام یک مزایای سلامتی بیشتری دارد؟
ماهواره آمریکایی هر ۲۰ دقیقه یکبار زمین را رصد میکند
بهترین نقطه برای زندگی انسانها روی مریخ کجاست؟
جلوه ترسناک صاعقه از نگاه فضانورد ناسا
کشف نشانهای جدید از وجود حیات در مریخ
زیاد خوردن لبنیات، کابوس شبانه میآورد
مغز انسان در پیری هم عصب میسازد
ترامپ اعلام کرد: مذاکرات برای فروش تیک تاک آغاز می شود
ضعف و قوت شبکه ملی اطلاعات در جنگ اخیر؛ فرماندهی سایبری باید تقویت شود
جزئیات ترم تابستانی دانشگاه فرهنگیان اعلام شد
موافقت با استخدام ۲۰۰ عضو هیأت علمی قراردادی دانشگاه فرهنگیان
فرصت مجدد برای ثبتنام جذب دانشجو معلم
آیا میتوان خاطرات را پس از مرگ نگهداری کرد؟
ربات انساننمای چینی از فاصله دور قابل کنترل است
بودجه ۷۵ میلیون دلاری برای ساخت سیستم عصبی هوشمند رباتها
تشخیص اسکیزوفرنی توسط هوش مصنوعی با دقت ۹۱ درصدی
هوش مصنوعی قربانی کردن یک انسان را به خاموش شدن ترجیح داد
کشف تغییرات سلولی که اختلال استرس پس از سانحه در مغز ایجاد میکنند
اسکن مغز، سرعت واقعی پیر شدن شما را فاش میکند
بارداری پس از ۱۸ سال به کمک هوش مصنوعی
قرص ورزش ساخته میشود!
با این عینک دیگر تبلیغات را نمیبینید!
وقایع روز عاشورا به تفکیک ساعت و مقتلهای معتبر
پاسخ به یک شبهه/ چرا امام حسین (ع) در روز عاشورا طلب باران نکرد؟
تصویر/ وقتی آقا گفت: ای ایران» بخوان
مدینه فاضله نیازمند تحقق فضائل اخلاقی است
فرهمندپور: اعتماد، حلقه اساسی زنجیره ولایت است/ غفلت و گناه آگاهانه، راه بازگشت را سختتر میکند
منظومه «ظهر روز دهم» یک اثر ادبی بینظیر برای نوجوانان
نگاهی به زندگی عباس (ع)علمدار لشکر سیدالشهدا و محافظ خیام
واقعه عاشورا حماسهای مبارزاتی و غنی از معارف اخلاقی و تربیتی است
حقالزحمه معلمان سوادآموزی بر چه اساسی پرداخت میشود؟
هر مدرسه یک پایگاه سلامت روان برای دانش آموزان
اطلاعیه دانشگاه علوم توانبخشی درباره امتحانات پایانترم و خوابگاه تابستانی
حضور مقتدرانه رهبر انقلاب در حسینیه امام خمینی (ره)
ما مطالبهگر حقوق از دسترفته مردم بیگناه ایران از مجامع بینالمللی هستیم
فراخوان دریافت یادداشتهای تخصصی-علمی با موضوع تجاوز رژیم صهیونیستی به ایران
فرصت مجدد برای جذب دانشجو معلم فراهم شد
با استخدام ۲۰۰ عضو هیأت علمی قراردادی دانشگاه فرهنگیان موافقت شد
اعلام جزئیات ترم تابستانی دانشگاه فرهنگیان
اعلام برنامههای آموزش و پرورش برای دانشآموزان در ایام اربعین
امشب آخرین فرصت انتخاب رشته آزمون دستیاری
تصویب استفاده از ظرفیت اساتید بازنشسته در دانشگاههای غیر انتفاعی
اشعار خواندنی شاعر قرن پنج هجری درباره حضرت علیاکبر(ع) و عاشورا
الزام دانشگاهها به تامین اسکان اساتیدی که منزلشان آنها آسیب دیده است
اعلام جزئیات پذیرش دانشجو در دوره دکتری استاد محور دانشگاه تهران
پیگیری استفاده از ظرفیتهای شورای عالی انقلاب فرهنگی برای موضوعات آموزش عالی
دل «مسجدالاقصی»ست، عزیز است و اسیر است/ بادا که رها گردد از بند شیاطین
نوحهای سوزناک برای امام حسین (ع) که بدون حتی یک فعل، معنا را منتقل میکند
تهدید رهبر انقلاب اعلان جنگ با مسلمانان است
انسانساز تعالیم اسلام دعوت به صبر و پایمردی است
تدارک شبکه قرآن برای روزهای تاسوعا و عاشورای حسینی
ریشه جنایات صهیونیستها در ماهیت تشکیلاتی و پادگان نظامی بودن اسرائیل نهفته است
ضرورت حفظ انسجام ملی و آمادگی همزمان با جریان طبیعی زندگی مردم در روزهای پس از جنگ
در دانشگاه صنعتی شریف مصممتر از قبل در راه توسعه علم و فناوری تلاش خواهیم کرد
اطلاعیه شماره 4 بانک سپه
دکتر پرتوافکنان عضو هیات مدیره بانک سپه در گفتگو با خبرگزاری صداوسیما از برقراری مجدد ارائه خدمات حضوری این بانک خبر داد
تشخیص خانگی سرطان و ایدز با نیم دلار هزینه
تبدیل آب آلوده به کود در ۶ ثانیه
آیا باید شارژرها را همیشه به برق متصل نگه داشت؟
پاکسازی سینوسهای عفونی با رباتهای فوق کوچک
ناتینگ فون ۳ با طراحی عجیبتر از همیشه معرفی شد
رونمایی از پنلهای خورشیدی نانویی خودتمیزشونده
راههای موثر برای مقابله با اینترنت استارلینک؛ تسریع توسعه فیبرنوری
برگزاری کارگاه کشوری توانمندسازی نیروی انسانی آموزش ابتدایی
آخرین وضعیت زمانبندی ثبتنام دانشآموزان در مدارس/ ارائه کارت ورود به جلسه آزمونهای سمپاد و نمونه از امروز
کاظمی: در هر شرایطی آموزش را ادامه خواهیم داد
تصویر/ وقتی آقا گفت: ای ایران» بخوان
تصویر/ شمر امروز را بشناس
پاسخ به یک شبهه/ چرا امام حسین (ع) در روز عاشورا طلب باران نکرد؟
نوحهای سوزناک برای امام حسین (ع) که بدون حتی یک فعل، معنا را منتقل میکند
وقایع روز عاشورا به تفکیک ساعت و مقتلهای معتبر
نگاهی به زندگی عباس (ع)علمدار لشکر سیدالشهدا و محافظ خیام
خداوند خود توبه را به گناهکاران پیشنهاد میکند؛ گناهانی که حسنه می شوند
روایت خواندنی بیهقی از حسینبنعلی علیه السلام
اشعار خواندنی شاعر قرن پنج هجری درباره حضرت علیاکبر(ع) و عاشورا
ترجمه قدیمیترین مقتل امام علی(ع) به کتابفروشیها آمد
۱۴ اقدام قرآنی که در شرایط بحرانی کشور صورت گرفت
وقایع روز ششم محرم/ روزی که آب بر اهل بیت (ع) بسته شد
دل «مسجدالاقصی»ست، عزیز است و اسیر است/ بادا که رها گردد از بند شیاطین
تهدید رهبر انقلاب اعلان جنگ با مسلمانان است
تأملی در آیات برکت و نسبت آن با خاندان وحی
انسانساز تعالیم اسلام دعوت به صبر و پایمردی است
تدارک شبکه قرآن برای روزهای تاسوعا و عاشورای حسینی
صحنه کربلا نماد دو چهره متضاد از انسان است
دمیدن روح همبستگی در جامعه ضرورتی در روزهای پس از جنگ
خانواده امام حسین (ع) الگویی خاص از خانواده عاشورایی
منظومه «ظهر روز دهم» یک اثر ادبی بینظیر برای نوجوانان
تحلیل ابعاد معنوی و عملی «طهارت» انسانی در پرتو قرآن و اهل بیت (ع)
مدینه فاضله نیازمند تحقق فضائل اخلاقی است
فرهمندپور: اعتماد، حلقه اساسی زنجیره ولایت است/ غفلت و گناه آگاهانه، راه بازگشت را سختتر میکند
واقعه عاشورا حماسهای مبارزاتی و غنی از معارف اخلاقی و تربیتی است
استقبال دانشگاه تهران از دهه دوم محرم با مراسم «از دانشگاه تا کربلا»
فرمانده نیروی هوافضای سپاه در مراسم عزاداری سالار شهیدان
تبدیل آب آلوده به کود در ۶ ثانیه
۳۴ دانشگاه ایرانی در جمع دانشگاههای تأثیرگذار تایمز سال ۲۰۲۵
ریشه جنایات صهیونیستها در ماهیت تشکیلاتی و پادگان نظامی بودن اسرائیل نهفته است
نظراتی که حاوی توهین یا افترا به اشخاص ،قومیت ها ،عقاید دیگران باشد و یا با قوانین کشور وآموزه های دینی مغایرت داشته باشد منتشر نخواهد شد - لطفاً نظرات خود را با حروف فارسی تایپ کنید.