کمپانی Open AI اخیرا هوش مصنوعی Voice Engine را برای شبیه‌سازی صدای افراد با نمونه‌برداری ۱۵ ثانیه‌ای از آن معرفی‌کرده‌است. شرکت Open AI با ارائه هوش‌مصنوعی Chat GPT تحولات بزرگی را در زمینه هوش‌مصنوعی ایجاد کرد. برنامه‌نویسان و سایر افراد آنقدر از این ابزار قدرتمند استقبال کردند که بسیاری از کمپانی‌های بزرگ سعی در خرید این شرکت و امتیاز اختراعات آن داشتند. این سیستم هوشمند می‌تواند لهجه کاربر را به زبان‌های دیگر منتقل کند. همچنین، هوش‌ مصنوعی Voice Engine  برای افراد دارای مشکلات صوتی یا کسانی که ناهنجاری گفتاری مانند التهاب حنجره دارند، می‌تواند جملات صحیح و واضح را تکرار کند.

قابلیت‌های هوش مصنوعی Voice Engine

  • تولید صدای با کیفیت فوق‌العاده: الگوریتم‌های پیشرفته هوش‌مصنوعی می‌تواند صدای افراد را به صورت رسا و طبیعی تقلید کند.
  • توانایی شبیه‌سازی صدا: این ابزار با یک نمونه ۱۵ ثانیه‌ای می‌تواند صدای مدنظر افراد را شبیه سازی کند و ظرافت های خاص صدا را حفظ کند.
  • توانایی پشتیبانی از چندین زبان مختلف: این هوش مصنوعی امکان تولید صدا در زمینه‌های مختلف زبانی را دارد.
  • ویژگی‌های صوتی قابل تنظیم: کاربران می‌توانند لحن صدا، زیر و بم و سایر ویژگی‌ها را طبق نیازهای خود تنظیم کنند.
  • ایجاد محتوایی کاربردی و سریع: توانایی تولید محتوای صوتی بر اساس تقاضا را ارائه می‌دهد و فرآیندهای تولید محتوا را ساده می‌کند.
  • خروجی صدای خالص: صداهایی بدون نویزهای پس‌زمینه تولید می‌کند و صدایی واضح را در اختیار کاربر می‌گذارد.

انتشار این سیستم نوین به کسب‌وکار‌ها کمک می‌کند تا از آن برای تولید کتاب‌های صوتی‌، آپلود اطلاعات صوتی برای ربات‌های گفت‌و‌گوی آنلاین یا حتی ساخت دیجی‌های خودکار ایستگاه‌های رادیویی استفاده کنند.

سایر توضیحات

اخیرا فناوری AI تا حدی پیشرفت کرده‌است که می‌تواند انواع گفت‌و‌گو را تشخیص دهد و جملات را درک کند. در واقع هوش‌ مصنوعی Voice Engine جنبه‌های مختلف گفت‌و‌گو شامل لهجه، احساسات، تایمینگ و تاکیدها را شناسایی می‌کند و سپس از آن‌ها برای تقلید باکیفیت استفاده می‌کند. این قابلیت ها در API تبدیل متن به صدا و قابلیت Read Aloud چت‌بات ChatGPT موجود است. فقط ۱۰ توسعه دهنده به این قابلیت‌ها دسترسی دارند. در حال حاضر کمپانی‌هاییAge of Learning و HeyGen به هوش‌مصنوعی Voice Engine دسترسی دارند.

این سیستم هوشمند نه تنها می‌تواند متن‌های مختلف را به زبان اصلی بخواند، بلکه قابلیت خواندن متن به زبان‌های دیگر را دارد. این ابزار قابلیت ترجمه نمونه‌های صوتی به زبان‌هایی همچون انگلیسی،آلمانی،فرانسوی و ژاپنی را دارد. با این ابزار فوق‌العاده هوشمند کاربر می‌تواند از میان یک کتابخانه متنوع از صداهای از پیش‌ساخته‌شده، شخصیت و لحن منحصر‌به فرد خود را انتخاب کند. همچنین کاربر می‌تواند احساسات خود را القا کند، احساساتی همچون شادی، غم یا خشم، زندگی را در صداهای مصنوعی خود تنفس کنید تا تجربه‌ای طبیعی و جذاب برای شنوندگان ایجاد کنید. این سیستم قابلیت این را دارد تا جزئیات صدا را به خوبی تنظیم کند. کاربر با استفاده از این امکانات می‌تواند پارامترهایی مانند زیر و بم، سرعت صحبت و حتی لهجه‌ها را تنظیم کند تا صدایی عالی بر اساس نیازهای خود ایجاد کند. اگر به مقالاتAI علاقه‌مندهستید، مقاله هوش‌مصنوعی REALM را برایتان پیشنهاد می‌‌کنیم.

اقدامات امنیتی و حریم خصوصی پیشرفته

این شرکت معروف، اعلام کرده‌است که فعلا این سیستم را به طور گسترده منتشر نمی‌کند، چون خطرات بالقوه آن به طور کامل شناسایی نشده‌است. برخی منتقدان می‌گویند که این قابلیت‌ها ممکن است  منجر به تسهیل تولید اطلاعات نادرست و کلاهبرداری شود. به عنوان مثال احتمال دارد متخلفان با تقلید صدای افراد معروف، اطلاعات نادرستی را در فضای مجازی منتشر کند. یکی از نگرانی‌های عمده این کمپانی در معرض خطر قرارگرفتن سد امنیتی تاییدکننده‌های صوتی برای دسترسی به حساب‌های بانکی آنلاین و سایر برنامه‌های شخصی است. Open AI در حال بررسی راهکارهایی برای واترمارک کردن صداهای جعلی یا اضافه کردن گزینه‌های کنترلی است. این راهکارها افراد را از استفاده ازاین سیستم  با صدای سیاستمداران یا دیگر حوزه‌های برجسته باز می‌دارد.

کاربرد هوش مصنوعی Voice Engine در زمینه‌های مختلف

هوش‌ مصنوعی Voice Engine این پتانسیل را دارد که چندین صنعت را متحول کند.

  • سازندگان محتوا: یوتیوببرها، پادکست‌ها و حتی فیلم‌سازان می‌توانند برای ایجاد روایت‌هایی از صداهای حرفه‌ای استفاده کنند و به محتوای خود عمق دهند.
  • تقویت سیستم آموزشی: موسسات آموزشی می‌توانند برای یادگیری بهتر و پویا تر از این ابزار استفاده کنند
  • ابزار بسیار کاربردی برای افرادی که اختلالات بینایی دارند: این هوش‌مصنوعی می‌تواند با تبدیل متن به حالت صوتی ، ابزاری بسیار مفید برای افرادی که اختلالات بینایی دارند می‌باشد.
  • در زمینه بازاریابی:  افراد می‌توانند در بیزینس خود با استفاده از صداگذاری های سفارشی سازی‌شده مخاطب خود را تحت تاثیر قرار دهند.