Deepfake es un tipo de inteligencia artificial que se utiliza para crear engaños de imágenes, audio y video convincentes. Describe tanto la tecnología como el contenido falso resultante, es un acrónimo de aprendizaje profundo y falso. Por ejemplo, Barack Obama llama a Donald Trump un «completo idiota», o Mark Zuckerberg se jacta de tener «el control total de miles de millones de datos robados de personas». ¿Has notado estos? Si es así, has visto un deepfake. La respuesta del siglo XXI al Photoshopping utiliza el aprendizaje profundo para crear imágenes de eventos falsos, de ahí el nombre deepfake.
Hoy en día, el software de código abierto como DeepFaceLab y Faceswap hacen videos deepfake. Estos programas utilizan un codificador automático para comprimir una cara en una representación muy compacta y luego decodificarla al original.
Para crear un deepfake, es necesario alimentar al programa con dos datos principales. Uno es la fuente: un video que incluye la cara que uno quiere intercambiar. El segundo es el destino: un video que agrega la cara por la que uno quiere intercambiar.
El programa requiere muchos videos buenos y de alta calidad tanto del origen como del destino para crear un video deepfake creíble para alimentar el codificador automático. Una vez que uno tiene los videos de origen y destino, la persona puede continuar con los siguientes pasos:
Lo primero que hace el programa es extraer imágenes de los videos de origen y destino. El programa se ejecuta a través de ambos videos y extrae capturas de pantalla fotograma a fotograma de todas las caras. Luego, las caras deben limpiarse manualmente. Indica que alguien debe desplazarse por las miles de imágenes de caras extraídas para eliminar cualquier foto que no sea relevante, como fotos de otras personas u objetos. Es un proceso tedioso y de horas que debe completarse para cada video deepfake creado.
La selección final de imágenes se realiza mediante codificación y decodificación para entrenar al codificador. El proceso de codificación extrae datos de la imagen y los comprime en su forma más pequeña llamada espacio latente.
La codificación se concentra en las partes de la cara que cambian a medida que la persona cambia sus expresiones faciales. Por ejemplo, no se centra en características como el color de ojos que permanecen relativamente constantes. En cambio, se centra en cosas como la ubicación de las cejas que cambia drásticamente a medida que uno habla.
La forma compacta de la imagen se vuelve a decodificar en la cara y se compara con el original. Este proceso se repite numerosas veces hasta que el codificador automático se entrena en esa cara. Este proceso de aprendizaje a través de la repetición representa la parte de la IA del deepfake.
Hitachi anunció la creación de una Fábrica Global de Inteligencia Artificial (IA), construida sobre la…
Miles de líderes mundiales se reunieron en la Semana del Clima de Nueva York 2025,…
El comercio electrónico mantiene un crecimiento constante y, con la incursión de la inteligencia artificial,…
“Hay una especie de burbuja publicitaria en el espacio de capital de riesgo en etapa…
HONOR acaba de inaugurar la HONOR ALPHA Store, un espacio definido por la compañía como…
América Latina y el Caribe muestra una adopción de inteligencia artificial que supera su peso…