La nueva IA de Meta Audiobox, que clona tu voz en segundos, ya se puede probar gratis desde España

La empresa matriz de Facebook, Instagram y WhatsApp está detrás de otras muchas tecnologías. Algunas de ellas son fruto del desarrollo de inteligencia artificial, como la que vamos a presentar y que ya usan los españoles. 
Audiobox es la plataforma para generar audio, discursos, sonidos y voces de Meta.
Audiobox es la plataforma para generar audio, discursos, sonidos y voces de Meta.
Meta
Audiobox es la plataforma para generar audio, discursos, sonidos y voces de Meta.

La inteligencia artificial (IA) podría clonar tu voz en pocos segundos y obtener resultados bastante realistas. Esta idea, que tantas preocupaciones puede generar en muchos usuarios, es ya un hecho con Audiobox, una herramienta creada por Meta, la empresa detrás de algunas de las apps más usadas de España (Facebook, Instagram, WhatsApp).

Según sus desarrolladores, la IA es el resultado de años de investigación y duro trabajo y, después de que se presentase por primera vez a principios de años... Por fin se puede utilizar en España y en otros países. Este modelo permitirá realizar tareas de generación de voz, como edición, muestreo y estilización, y pone sobre las cuerdas a actores de doblaje y hay quien tiene miedo de que pueda usarse para suplantar a personas.

Meta cuenta que Audiobox es el sucesor de Voicebox y que, gracias a sus avances en IA, sus consumidores podrán unificar las capacidades de generación y edición de voz, efectos de sonido y paisajes sonoros con otros mecanismos de entrada, con resultados personalizados caso por caso. 

Todo lo que se puede hacer con Audiobox

En el vídeo de demostración de la IA, Meta explica que se pueden generar voces de cero. Para ello, comenta que es necesario grabarse a uno mismo oa otra persona recitando un texto de ejemplo que se muestra en la pantalla. Es decir, no basta con tener un audio de alguien para crear audios con una voz concreta, sino que la empresa obliga a leer algo específico, para evitar suplantaciones.

Sin embargo, si no te sientes cómodo ante la idea de que tu voz sea imitada, Audiobox ofrece diferentes voces predefinidas por defecto. De este modo, habrá empresas que opten por esta herramienta para la voz en off de sus productos, algo que podría no sentarse muy bien a los actores de voz.

Por suerte, es complicado que esta tecnología pueda usarse en doblajes, ya que los diálogos no se podrán sincronizar con los gestos del actor que habla en otro idioma, ni para transmitir mensajes con emociones, puesto que todavía es difícil que una IA consiga transmitirla con voces robotizadas, por ejemplo.

Las funciones que Meta destaca de Audiobox y que, hasta la fecha, ninguna herramienta de IA podía realizar son las siguientes:

  • La generación de paisajes sonoros a partir de texto. Es decir, bastará con pedirle algo a la IA como 'un río corriendo y pájaros cantando' y esta creará algo que cumpla con esos requisitos. 
  • La creación de audios con un tono y ritmo concreto. Meta lo ejemplifica con un rápido: "Una mujer joven habla con un tono alto y a un ritmo rápido". 
  • La mezcla de un audio concreto en un entorno concreto o cambiar el tono o ritmo. Por ejemplo, se puede solicitar a la IA que una voz suene como si estuviese "en una catedral".

De momento, los resultados son voces que siguen siendo bastante robóticas, aunque suenan más reales que los creados por otras IA. Esto nos permite respirar tranquilamente, ya que no habrá nadie que pueda suplantar nuestra identidad y habrá empresas que sigan prefiriendo las voces de los actores de doblaje, incluso para las voces en off.

Meta evita el mal uso de Audiobox

Con el objetivo de Asegúrese de que Audiobox se utilice con finas nocivas, los audios tienen marcas de agua que permiten que se pueda rastrear con precisión de dónde proviene. En un comunicado de prensa, Meta explica que este distintivo es una señal que es imperceptible para el oído humano, pero que puede detectarse hasta el nivel del cuadro utilizando un modelo capaz de encontrar segmentos de audio generados por IA.

Por lo tanto, la marca de agua no supone un problema en el audio, para que así pueda emplearse en pódcast u otros servicios de escucha. No obstante, en caso de un ataque, se puede detectar rápidamente al culpable.

Además de eso, la obligación de leer un texto concreto en Audiobox antes de clonar la voz es un método con el que intenta evitar que se haga en contra de la voluntad de la persona afectada. El mensaje cambia a intervalos rápidos y regulares, por lo que es complicado agregar la voz de otra persona con audio pregrabado y esto podría estar presente.

¿Cómo usar Audiobox en España?

La nueva IA ya está disponible en nuestro país y acceder a ella es sumamente sencillo. Solo hay que acceder a este enlace: https://audiobox.metademolab.com/capabilities. Una vez hecho esto, hay que aceptar los términos y condiciones, y ya podrás disfrutar de todas las funciones de Audiobox desde tu ordenador.

Como ya hemos mencionado antes, la plataforma permite crear un audio con tu voz, generar audios teniendo en cuenta las peticiones que hagas por escrito, cambiar el estilo de un audio que facilites usando una descripción de texto, borrar ruidos de grabaciones, reemplazar partes de audios por nuevos sonidos y crear efectos de sonidos a partir de texto. No obstante, solo está disponible en inglés por el momento.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento