Audiobox: дивовижний штучний інтелект Meta для клонування голосів

аудіо коробка

Meta Він зумів вразити всіх своїм проектом Audiobox, генеративний штучний інтелект, здатний відтворювати людський голос із кількох секунд аудіо. Це не один із тих проектів, які чудово виглядають на папері, а потім закінчуються ні на що, оскільки анонс супроводжувався публічною демонстрацією цих можливостей.

Окрім голосів, Audiobox також може генерувати унікальні звуки за допомогою голосових або текстових підказок. У цій публікації ми розповімо вам усе, що відомо про цей проект, і, найкраще, як ви можете спробувати його самостійно.

Що таке Audiobox?

Audiobox — це назва, обрана для позначення фундаментальної моделі пошуку Meta генерація аудіо. Створення персоналізованого аудіо, яке можна застосовувати в різних ситуаціях і сценаріях, є результатом поєднання голосового введення та текстових підказок природною мовою.

Як пояснив Мета в заяві, це плід багатьох зусиль і років досліджень. І лише перший камінь цілого нового світу можливостей, який відкривається перед нами.

Важливість цього запуску потрібно оцінювати не лише в тому, «що», а й у тому, хто стоїть за проектом. Ми не повинні про це забувати Meta – це компанія, яка контролює деякі з найбільш використовуваних програм в Іспанії, таких як Facebook, Instagram або WhatsApp. Це відкриває двері для впровадження цієї нової технології в них через не надто довгий період часу.

Які можливості пропонує Meta Audiobox AI?

аудіобокс мета

Audiobox приносить нам шість унікальних функцій на основі штучний інтелект для створення та редагування аудіо. Вони надають у наше розпорядження широкий спектр можливостей налаштування. Вони такі:

  1. Створюйте аудіо нашим власним голосом, на основі будь-якого короткого зразка аудіо, навіть тривалістю кілька секунд. Ця функція дозволяє нам створити мову, яка імітує тон і стиль нашого власного голосу або голосу іншої людини.
  2. Описані голоси. Аудіо генерується з серії вказівок, описаних у тексті. Найкраще в цьому те, що це дає змогу створювати нові та унікальні голоси.
  3. Перероблені голоси. Ідея полягає в тому, щоб змінити тон і стиль справжнього голосу за допомогою текстового опису. Можна сказати, що це поєднання двох попередніх функцій на користь ще вищого рівня налаштування.
  4. Звукові ефекти. Окрім голосів, Audiobox від Meta здатний генерувати звукові ефекти з описового тексту.
  5. магічний аудіоредактор, зручний інструмент для видалення дратівливого фонового шуму із записів голосу.
  6. звукове наповнення. Функція, за допомогою якої можна замінити частину аудіо нові звуки.

Як бачите, Audiobox пропонує багато можливостей для аудіо-професіоналів і творців контенту, хоча це також дуже цікаво для будь-якого допитливого користувача. Наразі актори голосу можуть бути впевнені, оскільки з огляду на результати, Голоси, створені цим штучним інтелектом, все ще трохи роботизовані, позбавлені природності. Однак подолання цих невеликих незручностей – справа часу.

Як спробувати Audiobox

тест аудіобоксу

Найкращий спосіб перевірити цю нову технологію — спробувати її на собі. Це можливо через веб-демо Аудіобокс, створений нещодавно та все ще доступний абсолютно безкоштовно. Спосіб спробувати такий: запишіть свій власний голос (або зіграйте будь-який інший) і почніть з ним репетирувати. Це лише одна з можливостей, які пропонує нам ця технологія.

Хоча ця сторінка тестування на даний момент доступна в Іспанії можна використовувати лише англійською мовою, Це мова, яку нам доведеться використовувати для запиту текстів і створення аудіо. Ми спробували один із доступних жіночих голосів із фразою «Це голосовий тест для веб Movilforum» і ось результат:

Неправильне використання Audiobox Meta та інші тривожні проблеми

Однією з найдивовижніших особливостей Meta Audiobox є можливість генерувати наш власний голос за допомогою цього інструменту ШІ. Але, в той же час, це також породжує багато сумнівів і невпевненості, тому що про це планує загрозу можливого нецільового використання.

Щоб запобігти використанню цієї технології вчиняти шахрайство або шахрайство, Meta вимагає прийняти низку умов використання, перш ніж дозволити нам перевірити цю функціональність.

Окрім цього, згенеровані аудіофайли мають своєрідний «водяний знак», який дозволяє точно відстежити їх походження. У прес-релізі, про який ми згадували раніше, Meta пояснює, що ця особливість насправді є сигналом, який не сприймається людським вухом, але який можна виявити.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Actualidad Blog
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.