
به گزارش ثریا مایکروسافت جدیدترین پژوهشهای خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که میتواند صدای افراد را تنها از یک نمونه صوتی سه ثانیهای شبیهسازی کند.
پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کردهاند که میتواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.
گفتار نه تنها میتواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.
مایکروسافت میگوید، روزی میتوان از این ربات برای برنامههای کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپفیک(جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.
ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک»(neural codec language model) مینامد که از شبکه فشردهسازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونههای کوتاه از بلندگوی هدف تولید میکند.
پژوهشگران در مقالهای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح دادهاند. صدایی که این ربات سعی میکند تقلید کند باید با صدای دادههای آموزشی مطابقت داشته باشد.
این گروه دقیقاً نشان میدهد که این کار توسط VALL-E چقدر خوب انجام میشود. بنابراین برای هر عبارتی که میخواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیهای از گوینده برای تقلید کافی است.
البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آنها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.
این واقعیت که VALL-E لحن احساسی نمونههای اصلی را حفظ میکند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر میرسد که از همان مکان آمده است.
کار Vall-E در تقلید لهجهها نیز بسیار خوب است و حداقل لهجههای آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید میکند.
مایکروسافت برای بهبود این مدل قصد دارد دادههای آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راههایی برای کاهش کلماتی است که نامفهوم یا فراموش شدهاند.
پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت میتوان این گونه در نظر گرفت که کاربران میتوانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، میتوان با استفاده از این فناوری و جلوههای ویژه پروژه را پایان رساند.
اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشهها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمیتوان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.
پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، میتواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن میتوان هر دستگاه امنیتی تشخیص صدا را دور زد.
مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که میتواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبعباز قرار نداده است، چرا که از آنجایی که VALL-E میتواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوهای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.
این الگوریتم جدید نمونهای از بسیاری از الگوریتمهای هوش مصنوعی است که میتواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آنها را بازگو نکرده است.
ظهور هوش مصنوعیهای خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتمهای دیپفیک مختلف و تعداد بیشماری از الگوریتمهای دیگر به نظر میرسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاهها و ورود به دنیای واقعی کرده است. این فناوریها نیز مانند همه تغییرات دیگر، فرصتها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی میکنیم.
منبع: خبرگزاری ایسنا
چین لباسهای فضایی جدیدی را به ایستگاه فضایی تیانگونگ فرستاد
چرا لاکپشتها در برابر سرطان مصون هستند؟
ضرورت تلاش همهجانبه برای حضور ایمن و پرشور دانشآموزان و فرهنگیان در سفر تمدنساز اربعین
طرح حامی گامی راهبردی در مسیر قطع چرخه فقر آموزشی است
اعزام ۸ تیم المپیادی به رقابتهای جهانی از ۲۶ تیر تا ۲۰ مرداد/ کارشکنی فرانسه برای جلوگیری از درخشش دانشآموزان ایرانی در المپیاد فیزیک
عذرخواهی شرکت ایلان ماسک بهخاطر گراک
مقابله با سارقان محتوا در فیسبوک و اینستاگرام
مالک تیکتاک عینک واقعیت ترکیبی میسازد
عطش تراشهساز آمریکایی برای حضور در بازار چین
ارزیابی تکمیلی داوطلبان اعزام به مدارس از کشور / انتخاب ۴۷۰ نفر جهت اعزام
کاوشگر ناسا رکورد شکست
هوش مصنوعی کلود طراح شد!
خاورمیانه برای پذیرش هوش مصنوعی آماده است؟
کمبود بودجه به ناسا رسید؛ خروج ۲هزار مدیر!
برای خواندن دست اپل از سامسونگ چشم برندارید!
ببینید؛ رونمایی از سریعترین قطار چین با سرعت ۶۰۰ کیلومتر بر ساعت
جنگ سایهها؛ چگونه اختلال در GPS زندگی روزمره ایرانیان را مختل کرد؟
جراحی کیسه صفرای خوک با روبات هوشمند
دسترسی به دامنههای .ir دچار مشکل شد
هفت تغییر مهم که در آیفون ۱۷ خواهیم دید
ساخت مخازن سبک و ایمن هیدروژن مایع با نانوصفحات گرافنی
حجم مغز افراد روانآزار کمتر است
روباتها سربازان روسی را اسیر کردند
نقشه راه جدید دانشگاه شهید بهشتی برای همکاری گسترده با صنعت
ماموریت آکس-۴ ایستگاه فضایی بینالمللی را ترک کرد
نحوه محاسبه نمره نهایی در پذیرش دانشجو معلمان چگونه است؟
بودجه دانشگاه آزاد زیر ذرهبین؛ تاکید بر پایداری اقتصادی
یک ماده خنککننده جدید توسط هوش مصنوعی کشف شد
هوش مصنوعی؛ شریک آیندهنگر مدیریت بحرانهای جهانی
عکس روز ناسا از یک فرورفتگی در مریخ
غم اگر تصویر بود: نفس دختر ۲ ساله شهید حمید آزکات
تصویر/ دختر بچه اهل غزه که به دلیل وحشت و ترس موهای سرش ریخته است
المپیاد فناورانه امیرکبیر؛ گامی برای تقویت ورزش دانشجویی
واکنش وزارت ارتباطات به اختلال مسیریابها؛ ملاحظات استفاده از واتس اپ
معاون وزیر علوم به سوالات کنکوریها در تلویزیون جواب میدهد
سهم ۶۰ درصدی تاثیر سوابق تحصیلی در کنکور
از چتباتهای هوش مصنوعی برای رواندرمانی استفاده نکنید!
غصه شنبه از نظر علمی ثابت شد!
جایگزینی یک تزریق هفتگی با قرصها برای بیماران پارکینسون
کشف ارتباط ساعت داخلی بدن و وعدههای غذایی با خطر چاقی و دیابت
اروپا با طرحی بلندپروازانه، انقلاب کوانتومی خود را کلید میزند
پاکسازی موفق چاه نفت با فناوری نوین در شرکتهای دانشبنیان دانشگاه شیراز
ستاد پیگیری و پشتیبانی از آسیب دیدگان جنگ تحمیلی در وزارت علوم تشکیل میشود
اعمال ۴۰ درصدی نمره کنکور در پذیرش نهایی دانشجو در سال ۱۴۰۴
زمان اعلام نتیجه اولیه و نهایی کنکور ۱۴۰۴ مشخص شد
آمادگی بانک سپه برای پرداخت تسهیلات ازدواج و فرزندآوری
معرفی جوانترین و مسنترین داوطلبان نوبت دوم کنکور
چهارشنبه، آخرین مهلت دریافت کارت کنکور/داوطلبان برای تغییر حوزه و گروه به باجهها مراجعه نکنند
راهاندازی سامانه یادگیری مجازی برای توانمندسازی معلمان/ برگزاری دورههای تلفیقی حضوری و مجازی توانمندسازی
۱۵ درصد داوطلبان کنکور از استان تهران هستند/برگزاری آزمون در ۱۵ حوزه خارجی
رونمایی از هویت بصری جدید پنجره واحد خدمات الکترونیک آموزش و پرورش مای مدیوو توسعه قابلیتهای نوین
میدان پویا؛ برنامهای جدید برای تقویت اوقات فراغت تابستانی دانشآموزان
امکان ساخت رگهای خونی جدید در بدن با کمک نانوسیلیکات
هوش مصنوعی در دولتها؛ ابزار پیشرفت یا تهدیدی برای دموکراسی؟
تولد اولین گاومیش شبیهسازیشده جهان از طریق سزارین
تولید کرمهای نانویی ضد آفتاب و مرطوب کننده با جذب سریع
عینک نوردرمانی راهی برای شناخت سالمندان در مراحل ابتدایی آلزایمر عینک نوردرمانی راهی برای شناخت سالمندان در مراحل ابتدایی آلزایمر
عکس روز ناسا از کهکشان هلیکس
گرد و غبار و فرونشست زمینشناسی دو چالش مهم اصفهان
نزدیک ترین تصاویر از سطح خورشید منتشر شد
آیا ورزش واقعاً سلامت روان را بهبود میبخشد؟
فنی اما ساده: تکلیف ضایعات داخل توالتهای هواپیما چه میشود؟
معرفی نسخه جدید شاسیبلند وارداتی ایران
پایان مزاحمت ماهوارهها برای اخترشناسان
محققان از فواید سلامت شگفتانگیز هندوانه پرده برداشتند
روبات پوشیدنی در شرکت هواپیمایی کره استخدام شد
فراخوان ساخت محصول افشانه سلولی برای ترمیم زخمهای پوستی
زنبورهای عسل جاسوس چین شدند
سرعت بخشی به برنامههای پروژه ملی مهر
چتجیپیتی فارسی؛ ابزار بومی برای تولید محتوا و تحلیل هوشمند فروشگاههای اینترنتی
آسیب نور شهرهای بزرگ به سلامت قلب
هوش مصنوعی اوپن ایآی قهرمان شد
هوش مصنوعی به زودی با حیوانات خانگی حرف میزند
فیلها با حرکات خود، خواستههایشان را بیان میکنند
نشست بررسی ملاحظات پدافند غیرعامل در برنامهریزی شهری برگزار میشود
نانوپوششی که ماهوارهها را در آسمان نامرئی میکند
کشفی که مسیر ساخت مواد رساناتر را هموار میکند
صرفهجویی ۹۹ درصدی در مصرف انرژی با فتوکاتالیستهای نقاطکوانتومی
عکس روز ناسا از سحابی مورچه
رنگهای مدل پایه آیفون ۱۷ لو رفت
شعری زیبا/میشود من هم برایت شعر «ای ایران» بخوانم؟
پیام تسلیت دبیر شورای عالی انقلاب فرهنگی در پی ارتحال حجتالاسلام والمسلمین دکتر سید محمدباقر حجتی
تصویر/ دختر بچه اهل غزه که به دلیل وحشت و ترس موهای سرش ریخته است
غم اگر تصویر بود: نفس دختر ۲ ساله شهید حمید آزکات
«مرگ مغزی جامعه شناسی ایرانی» بررسی میشود
تغییر قبله به سمت کعبه معظمه برای دشمنان اسلام شکننده بود
تصویر/ کتابت قرآن در مدت کمتر از ۳ سال توسط یک کودک هندی
منابع تاریخی که به وجود حضرت رقیه (س) و اتفاقات شام اشاره میکنند
کودک اهل کتاب ایرانی، آیندهساز گفتوگو و دانایی است
اگر دلتان یک مجموعه شعر میخواهد «باران کبوتر» منتشر شد
شرکت ۳۵۰۰ نفر در پویش قرآنی «به نام پیروزی»
نگاهی به مراحل هفت گانه سلوک تا شهود عرفانی در پرتو مقاومت عرفانی
تصویر/ هیئات با پیوند «ایده، شعر و اجرا» از مکتب حسین به ایران حسین پل زدند
شروط قرآن برای پیروزی یک جامعه در برابر توطئههای دشمن
روایت خواندنی سردبیر تهران تایمز از روزنامهنگاری در جنگ
نویسنده زن سودانی جایزه قلم پینتر ۲۰۲۵ را گرفت
همگرایی اسلامیت و ایرانیت پشتوانه هویتی و فرهنگی ایران عزیز
بازسازی اعتماد به چیزی فراتر از تبلیغات و رسانه نیاز دارد
منوی عجیب یک پیتزافروشی در نیاوران تهران که پربازدید شد
درمان سادهای که میتواند از ۷۵ درصد سرطانهای معده جلوگیری کند
در معرض ابتلا به آلزایمر هستید؟/ چهار مسیر منتهی به این بیماری را بشناسید
احتمال تغییر زمان امتحانات گواهینامه و ارتقا برای برخی دستیاران پزشکی
.ترفند رسانهای رژیم صهیونیستی برای توجیه تجاوز نظامی به ایران
میراث شهید طهرانچی: تحول در جذب و ارتقای استادان
انقلاب انویدیا در هوش مصنوعی با پاسخدهی ۳۲ برابر سریعتر به کاربران
استفاده از نانوحباب برای مهار گازهای گلخانهای
برگزاری ۱۱ آزمون گروه علوم پزشکی در مردادماه امسال
یافتههای دانشمند ایرانی درباره توانایی چتجیپیتی در درک رنگها
ابتکار دانشمند ایرانی در استفاده از چوب برای افزایش طول عمر باتری
یکپنجم سال زیر تیغ فرابنفش؛ ازون از ما محافظت میکند ولی نه همیشه
نظراتی که حاوی توهین یا افترا به اشخاص ،قومیت ها ،عقاید دیگران باشد و یا با قوانین کشور وآموزه های دینی مغایرت داشته باشد منتشر نخواهد شد - لطفاً نظرات خود را با حروف فارسی تایپ کنید.