Talking Selfie convierte fotos en cabezas parlantes terriblemente realistas

Posted On: septiembre 27, 2021
Posted By: Merlín Santistevan
Comments: 0

D-ID, la empresa cuya tecnología impulsa Aplicación MyHeritage, mostró un nuevo uso de su tecnología. Llamado «Retrato hablado», permite que cualquier imagen sea animada con un realismo asombroso y es capaz de decir lo que el usuario quiera.

mi herencia Ella llegó a los titulares por primera vez en 2020 con el lanzamiento de «potenciador de fotos» Una herramienta que utiliza inteligencia artificial para recuperar fotos familiares antiguas. A principios de este año, MyHeritage llevó su negocio un paso más allá y desarrolló profunda nostalgia, capaz de animar a las personas a partir de fotos.

puntiagudo en un betapixel portada originalEn el núcleo de la aplicación, la IA tiene licencia de D-ID, que se especializa en la recreación de videos mediante el aprendizaje profundo. No satisfecho con los laureles de una profunda nostalgia, D-ID mostró una nueva implementación de su tecnología que puede animar la imagen y permitir que el usuario la controle en tiempo real.

como reportado por Toma Crunch, el resultado puede parecer bastante parecido a una «falsificación profunda» que se está volviendo cada vez más precisa en línea, pero se asume que la tecnología detrás de la imagen hablada es muy diferente y hacer una imagen básica no requiere entrenamiento. La implementación de esta nueva tecnología se demostró específicamente en TechCrunch Disrupt 2021 que concluyó la semana pasada.

Las selfies parlantes permiten que cualquier persona cree un video Full HD a partir de una imagen de origen y puede combinar estas animaciones con voz grabada o texto escrito. D-ID planea lanzar el producto con soporte para solo tres idiomas: inglés, español y japonés, pero planea agregar otros idiomas a pedido.

READ Google recuerda la presencia de Voice y agrega nuevas funciones para llamadas perdidas e identificador de llamadas

Hay dos categorías de imagen hablada: la primera se llama «Personalidad entrenada» y requiere la presentación de un video de entrenamiento de 10 minutos del personaje solicitado que debe coincidir con las instrucciones proporcionadas por el D-ID. Si bien este requiere mucho trabajo, da como resultado una animación de personajes con mucha fluidez que también admite la capacidad de cambiar de fondo.

A continuación se muestra un ejemplo de un presentador de noticias generado por IA que se creó utilizando el método «entrenado por la personalidad».

Usar 10 minutos de tiros entrenados nos recuerda la tecnología que solía ser Publicado por 1st Hour Feb. En él, los usuarios pueden crear un «clon de IA» de sí mismos y, una vez entrenados, pueden hablar y moverse como el original.

Pero quizás otra aplicación de la tecnología D-ID sea aún más impresionante: Imagen única. Se pueden hacer en cualquier imagen estática y moverán la cabeza mientras las otras partes permanecen quietas y los fondos no se pueden reemplazar. Sin embargo, el resultado a continuación muestra cómo los movimientos y las expresiones faciales de una persona real se agregan fácilmente a una imagen fija. Un humano puede actuar como una especie de titiritero de la imagen fija.

El cofundador y CEO de D-ID entiende que existen riesgos potenciales con este tipo de tecnología y le dijo a TechCrunch que él y su compañía «están ansiosos por asegurarse de que se use para el bien, no para el mal». Si bien la empresa hará todo lo posible para crear garantías como tal, planea asociarse con otros en el lugar para tratar de evitar el abuso.

READ El enrutador Google OnHub se unirá a la lista de productos muertos de Google el próximo diciembre