لا تستنسخ صوت شخص آخر ! .. أفضل 4 أدوات لاستنساخ أي صوت بالذكاء الإصطناعي

يمكننا القول أن عام 2024 سيكون العام العظيم للذكاء الاصطناعي لعامة الناس. تزدهر تطبيقات إنشاء الصور من النص، كما أن النماذج اللغوية مثل ChatGPT تغير صناعات بأكملها بين عشية وضحاها.

ويشهد استنساخ الصوت باستخدام الذكاء الاصطناعي أيضًا تطورات هائلة في الأشهر الأخيرة، ويمكن اعتباره الآن تقنية ناضجة بما يكفي للحصول على العديد من الاستخدامات العملية مع تحقيق النتائج الأكثر مصداقية.

إذا كنت لا تزال غير متأكد من الغرض من استنساخ الصوت، فستكون مهتمًا بمعرفة أنها تقنية تزييف عميق قادرة على تحديد ونسخ وتكرار نبرة الصوت والتصريفات والفروق الدقيقة في كلام الشخص من خلال الذكاء الاصطناعي.

بمجرد تدريب الذكاء الاصطناعي وتعلم كيفية عمل هذا الصوت، يمكننا أن نطلب منه قراءة أي نص باستخدام صوت ذلك الشخص. يتيح لنا ذلك استخدام الذكاء الاصطناعي لجعل هذا الشخص يظهر في مقطع فيديو أو مقطع صوتي وهو يتحدث بلغة أخرى، ولكن أيضًا لأشياء أخرى كثيرة. في الواقع، يمكنك اليوم استخدام استنساخ الصوت لمقاطع الفيديو الصوتية أو النصوص أو الكتب الصوتية بصوتك دون الحاجة إلى إجراء عملية تسجيل شاقة أو الحصول على معدات صوتية جيدة.

في الآونة الأخيرة، انتشرت على نطاق واسع العديد من الميمات والمونتاج الفكاهي بأصوات مستنسخة من المشاهير. كن حذرًا، وتذكر أن استنساخ صوت شخص آخر دون إذنه هو أمر غير أخلاقي، وبصرف النظر عن مدى "مرحه" في لحظة معينة، فقد يكون له أيضًا عواقب قانونية. استخدم هذه الأنواع من الأدوات فقط للأغراض المشروعة.

- VoiceLab de ElevenLabs

لدى ElevenLabs أحد أفضل برامج استنساخ الصوت في الوقت الحالي. يمكنك استنساخ صوت بعينة صوتية مدتها دقيقة واحدة فقط، وتحقيق نتائج واقعية واحترافية للغاية باستخدام ما لا يقل عن 30 دقيقة من صوتك.

ومن التفاصيل المثيرة للاهتمام أن التطبيق يحتوي على نظام تحقق للتحقق من أننا لا نقوم باستنساخ صوت شخص آخر. ومن هناك، يمكننا استنساخ صوتنا بما يصل إلى 28 لغة وأكثر من 50 لهجة مختلفة.

يتيح لك ElevenLabs في نسخته المجانية استخدام ما يصل إلى 10000 حرف شهريًا، مع 3 أصوات مخصصة وصوت عالي الجودة بسرعة 128 كيلوبت في الثانية.

- Deep Voice 3

 هو برنامج استنساخ صوتي مفتوح المصدر يمكنك تثبيته على جهاز الكمبيوتر الخاص بك لاستخدامه محليًا. وهو متاح من خلال GitHub وهو تطبيق عصبي لتحويل النص إلى كلام (TTS) يستخدم تقنيات التعلم العميق لتجميع الأصوات البشرية.

تعد عملية تثبيت وتكوين Deep Voice 3 متقدمة جدًا وتتطلب معرفة تقنية، لذا يوصى به فقط لأولئك الذين لديهم الكثير من وقت الفراغ ويريدون "الصلصة" قليلاً.

- Resemble AI

مع Resemble يمكنك استنساخ صوتك من خلال تسجيل 25 عبارة فقط بالميكروفون، أو بمعنى آخر توفير حوالي 3 دقائق من البيانات. من هناك، سيكون الذكاء الاصطناعي قادرًا على تدريب نفسه وتوليف صوتك بشكل صحيح، وتجنب الأصوات الروبوتية النموذجية التي تبدو سيئة للغاية في بعض مستنسخات الصوت البدائية.

بفضل نتائجه الواقعية للغاية، يضم Resemble حاليًا أكثر من مليون مستخدم. بالطبع، ضع في اعتبارك أن هذه أداة متميزة تستهدف السوق الاحترافية، بسعر أساسي قدره 0.006 دولار في الثانية.

- Tortoise-TTS

هي أداة أخرى مفتوحة المصدر للمستخدمين المتقدمين. يتم تشغيل التطبيق من Google Colab Notebook ويتطلب استخدام برنامج تسجيل مثل Audacity لتوفير عينة صوتية للذكاء الاصطناعي.

وميزة هذا النوع من الأدوات  هي أنها مجانية. إذا كنت ترغب في تجربتها ، يمكنك إلقاء نظرة على موقع المشروع على GitHub . يمكنك أيضًا العثور على برنامج تعليمي مثير للاهتمام على  اليوتوب حول كيفية إجراء عملية الاستنساخ بأكملها خطوة بخطوة.

- LOVO

 هو أحد تطبيقات الويب المتخصصة في استنساخ الأصوات. ويتطلب تسجيلًا صوتيًا لمدة دقيقة واحدة على الأقل، والذي يمكن أن يكون من خلال ميكروفون أو ملف صوتي. الحقيقة هي أن العملية بسيطة ومباشرة حقًا.

على الرغم من أن هذا تطبيق متميز آخر، إلا أن LOVO لديه فترة تجريبية مجانية مدتها 14 يومًا واستنساخ ما يصل إلى 5 أصوات مختلفة، على الرغم من عدم إمكانية تنزيل الصوتيات التي تم إنشاؤها.

from حوحو للمعلوميات https://ift.tt/2MOYlJN
via IFTTT
تعليقات