
به گزارش ثریا مایکروسافت جدیدترین پژوهشهای خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که میتواند صدای افراد را تنها از یک نمونه صوتی سه ثانیهای شبیهسازی کند.
پژوهشگران شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کردهاند که میتواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.
گفتار نه تنها میتواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.
مایکروسافت میگوید، روزی میتوان از این ربات برای برنامههای کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپفیک(جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.
ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک»(neural codec language model) مینامد که از شبکه فشردهسازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونههای کوتاه از بلندگوی هدف تولید میکند.
پژوهشگران در مقالهای، نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح دادهاند. صدایی که این ربات سعی میکند تقلید کند باید با صدای دادههای آموزشی مطابقت داشته باشد.
این گروه دقیقاً نشان میدهد که این کار توسط VALL-E چقدر خوب انجام میشود. بنابراین برای هر عبارتی که میخواهید هوش مصنوعی آن را بگوید، یک پیام سه ثانیهای از گوینده برای تقلید کافی است.
البته نتایج کار این ربات در حال حاضر، ترکیبی است و برخی از آنها شبیه به صدای ماشینی و برخی دیگر به طرز شگفت آوری واقعی هستند.
این واقعیت که VALL-E لحن احساسی نمونههای اصلی را حفظ میکند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر میرسد که از همان مکان آمده است.
کار Vall-E در تقلید لهجهها نیز بسیار خوب است و حداقل لهجههای آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید میکند.
مایکروسافت برای بهبود این مدل قصد دارد دادههای آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راههایی برای کاهش کلماتی است که نامفهوم یا فراموش شدهاند.
پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت میتوان این گونه در نظر گرفت که کاربران میتوانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، میتوان با استفاده از این فناوری و جلوههای ویژه پروژه را پایان رساند.
اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشهها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمیتوان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.
پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، میتواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن میتوان هر دستگاه امنیتی تشخیص صدا را دور زد.
مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که میتواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبعباز قرار نداده است، چرا که از آنجایی که VALL-E میتواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوهای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.
این الگوریتم جدید نمونهای از بسیاری از الگوریتمهای هوش مصنوعی است که میتواند صدای ضبط شده یک فرد را تقلید کند و کلمات و جملاتی را بیان کند که شخص مورد نظر هرگز آنها را بازگو نکرده است.
ظهور هوش مصنوعیهای خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتمهای دیپفیک مختلف و تعداد بیشماری از الگوریتمهای دیگر به نظر میرسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاهها و ورود به دنیای واقعی کرده است. این فناوریها نیز مانند همه تغییرات دیگر، فرصتها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی میکنیم.
منبع: خبرگزاری ایسنا
وقایع روز عاشورا به تفکیک ساعت و مقتلهای معتبر
پاسخ به یک شبهه/ چرا امام حسین (ع) در روز عاشورا طلب باران نکرد؟
تصویر/ وقتی آقا گفت: ای ایران» بخوان
مدینه فاضله نیازمند تحقق فضائل اخلاقی است
فرهمندپور: اعتماد، حلقه اساسی زنجیره ولایت است/ غفلت و گناه آگاهانه، راه بازگشت را سختتر میکند
منظومه «ظهر روز دهم» یک اثر ادبی بینظیر برای نوجوانان
نگاهی به زندگی عباس (ع)علمدار لشکر سیدالشهدا و محافظ خیام
واقعه عاشورا حماسهای مبارزاتی و غنی از معارف اخلاقی و تربیتی است
حقالزحمه معلمان سوادآموزی بر چه اساسی پرداخت میشود؟
هر مدرسه یک پایگاه سلامت روان برای دانش آموزان
اطلاعیه دانشگاه علوم توانبخشی درباره امتحانات پایانترم و خوابگاه تابستانی
حضور مقتدرانه رهبر انقلاب در حسینیه امام خمینی (ره)
ما مطالبهگر حقوق از دسترفته مردم بیگناه ایران از مجامع بینالمللی هستیم
فراخوان دریافت یادداشتهای تخصصی-علمی با موضوع تجاوز رژیم صهیونیستی به ایران
فرصت مجدد برای جذب دانشجو معلم فراهم شد
با استخدام ۲۰۰ عضو هیأت علمی قراردادی دانشگاه فرهنگیان موافقت شد
اعلام جزئیات ترم تابستانی دانشگاه فرهنگیان
اعلام برنامههای آموزش و پرورش برای دانشآموزان در ایام اربعین
امشب آخرین فرصت انتخاب رشته آزمون دستیاری
تصویب استفاده از ظرفیت اساتید بازنشسته در دانشگاههای غیر انتفاعی
اشعار خواندنی شاعر قرن پنج هجری درباره حضرت علیاکبر(ع) و عاشورا
الزام دانشگاهها به تامین اسکان اساتیدی که منزلشان آنها آسیب دیده است
اعلام جزئیات پذیرش دانشجو در دوره دکتری استاد محور دانشگاه تهران
پیگیری استفاده از ظرفیتهای شورای عالی انقلاب فرهنگی برای موضوعات آموزش عالی
دل «مسجدالاقصی»ست، عزیز است و اسیر است/ بادا که رها گردد از بند شیاطین
نوحهای سوزناک برای امام حسین (ع) که بدون حتی یک فعل، معنا را منتقل میکند
تهدید رهبر انقلاب اعلان جنگ با مسلمانان است
انسانساز تعالیم اسلام دعوت به صبر و پایمردی است
تدارک شبکه قرآن برای روزهای تاسوعا و عاشورای حسینی
ریشه جنایات صهیونیستها در ماهیت تشکیلاتی و پادگان نظامی بودن اسرائیل نهفته است
ضرورت حفظ انسجام ملی و آمادگی همزمان با جریان طبیعی زندگی مردم در روزهای پس از جنگ
در دانشگاه صنعتی شریف مصممتر از قبل در راه توسعه علم و فناوری تلاش خواهیم کرد
اطلاعیه شماره 4 بانک سپه
دکتر پرتوافکنان عضو هیات مدیره بانک سپه در گفتگو با خبرگزاری صداوسیما از برقراری مجدد ارائه خدمات حضوری این بانک خبر داد
تشخیص خانگی سرطان و ایدز با نیم دلار هزینه
تبدیل آب آلوده به کود در ۶ ثانیه
آیا باید شارژرها را همیشه به برق متصل نگه داشت؟
پاکسازی سینوسهای عفونی با رباتهای فوق کوچک
ناتینگ فون ۳ با طراحی عجیبتر از همیشه معرفی شد
رونمایی از پنلهای خورشیدی نانویی خودتمیزشونده
راههای موثر برای مقابله با اینترنت استارلینک؛ تسریع توسعه فیبرنوری
برگزاری کارگاه کشوری توانمندسازی نیروی انسانی آموزش ابتدایی
آخرین وضعیت زمانبندی ثبتنام دانشآموزان در مدارس/ ارائه کارت ورود به جلسه آزمونهای سمپاد و نمونه از امروز
کاظمی: در هر شرایطی آموزش را ادامه خواهیم داد
چراغ سبز کنگره آمریکا به پروژه ناسا برای رسیدن به ماه
ارائه روشی نوین برای تحلیل گسلها با دقت بالا
عکس روز ناسا از یک نواختر در دل آسمان
پای هوش مصنوعی گوگل به بازیهای ویدیویی باز میشود
اعلام زمان برگزاری آزمون عملی و تشریحی آزمون کارشناسیارشد سال ۱۴۰۴
۳۴ دانشگاه ایرانی در جمع دانشگاههای تأثیرگذار تایمز سال ۲۰۲۵
اجرای آزمایشی طرح مدرسه اولیا در هر استان با انتخاب یک مدرسه آغاز خواهد شد
ایرانسل، اینترنت را گران کرد
تهویه هوا با هوش مصنوعی و صرفه جویی ۴۰درصدی انرژی
اولین قدم برای تحقق ژنوم مصنوعی انسان
انفجار دو نواختر جدید در آسمان
ویروس جدید در خفاشها شناسایی شد
چت جیپیتی از مردم خواست به این خبرنگار ایمیل بزنند!
فرمانده نیروی هوافضای سپاه در مراسم عزاداری سالار شهیدان
تصویر/ شمر امروز را بشناس
وقایع روز ششم محرم/ روزی که آب بر اهل بیت (ع) بسته شد
ترجمه قدیمیترین مقتل امام علی(ع) به کتابفروشیها آمد
روایت خواندنی بیهقی از حسینبنعلی علیه السلام
دمیدن روح همبستگی در جامعه ضرورتی در روزهای پس از جنگ
تأملی در آیات برکت و نسبت آن با خاندان وحی
صحنه کربلا نماد دو چهره متضاد از انسان است
روح حاکم بر مقاومت عرفانی در ارتباط با توحید در زندگی است
خانواده امام حسین (ع) الگویی خاص از خانواده عاشورایی
۱۴ اقدام قرآنی که در شرایط بحرانی کشور صورت گرفت
مرد اول ایران که به قدرت و اقتدار او کسی نیامده
نرخ غذا و خوابگاه دانشجویی اواخر تیرماه اعلام میشود
تشریح اقدامات معاونت فرهنگی و دانشجویی وزارت بهداشت در دوران جنگ ۱۲ روزه
برگزاری امتحانات شهریور دانشگاهها به صورت حضوری
نرمافزارهای نفوذ چگونه وارد کشور شده است؟
تصاویر جدید گلکسی واچ ۸ کلاسیک فاش شد
جزئیات تغییر ساعت کاری دانشگاه آزاد مشخص شد
اطلاعات ۶ میلیون مشتری شرکت هواپیمایی استرالیایی هک شد
چگونه اینترنت را در شرایط بحرانی امن کنیم
حمایت از دانشجویان در رشتههای حساس علمی در دستور کار ایران
تبدیل زباله به گنج؛ بیرون کشیدن گرافن و هیدروژن از دل پسماند نفتی
آغاز پذیرش بدون آزمون دکتری به شیوه استادمحور در دانشگاه شهیدبهشتی
تصویر/ شمر امروز را بشناس
نوحهای سوزناک برای امام حسین (ع) که بدون حتی یک فعل، معنا را منتقل میکند
پاسخ به یک شبهه/ چرا امام حسین (ع) در روز عاشورا طلب باران نکرد؟
تصویر/ وقتی آقا گفت: ای ایران» بخوان
روایت خواندنی بیهقی از حسینبنعلی علیه السلام
وقایع روز عاشورا به تفکیک ساعت و مقتلهای معتبر
نگاهی به زندگی عباس (ع)علمدار لشکر سیدالشهدا و محافظ خیام
اشعار خواندنی شاعر قرن پنج هجری درباره حضرت علیاکبر(ع) و عاشورا
ترجمه قدیمیترین مقتل امام علی(ع) به کتابفروشیها آمد
۱۴ اقدام قرآنی که در شرایط بحرانی کشور صورت گرفت
وقایع روز ششم محرم/ روزی که آب بر اهل بیت (ع) بسته شد
نمیتوان حریم دیگران را نقض کرد؛ توجه امام حسین (ع) به محل شهادتاش
دل «مسجدالاقصی»ست، عزیز است و اسیر است/ بادا که رها گردد از بند شیاطین
تهدید رهبر انقلاب اعلان جنگ با مسلمانان است
فتاوایی که گفتمانسازی در فقه امنیت دینی است
تأملی در آیات برکت و نسبت آن با خاندان وحی
انسانساز تعالیم اسلام دعوت به صبر و پایمردی است
تدارک شبکه قرآن برای روزهای تاسوعا و عاشورای حسینی
صحنه کربلا نماد دو چهره متضاد از انسان است
دمیدن روح همبستگی در جامعه ضرورتی در روزهای پس از جنگ
خانواده امام حسین (ع) الگویی خاص از خانواده عاشورایی
منظومه «ظهر روز دهم» یک اثر ادبی بینظیر برای نوجوانان
فرهمندپور: اعتماد، حلقه اساسی زنجیره ولایت است/ غفلت و گناه آگاهانه، راه بازگشت را سختتر میکند
تبدیل آب آلوده به کود در ۶ ثانیه
واقعه عاشورا حماسهای مبارزاتی و غنی از معارف اخلاقی و تربیتی است
مدینه فاضله نیازمند تحقق فضائل اخلاقی است
حمایت از دانشجویان در رشتههای حساس علمی در دستور کار ایران
مرد اول ایران که به قدرت و اقتدار او کسی نیامده
فرمانده نیروی هوافضای سپاه در مراسم عزاداری سالار شهیدان
نگاهی به دستاوردهای شهید طهرانچی در دانشگاه آزاد
نظراتی که حاوی توهین یا افترا به اشخاص ،قومیت ها ،عقاید دیگران باشد و یا با قوانین کشور وآموزه های دینی مغایرت داشته باشد منتشر نخواهد شد - لطفاً نظرات خود را با حروف فارسی تایپ کنید.