El lanzamiento de Sora de OpenAI abrió las puertas a aplicaciones de generación de vídeos impulsadas por IA que pueden crear clips cortos a partir de indicaciones de texto. Ahora, Google también ha saltado a la palestra al anunciar su propia aplicación de IA para generar videos, Veo, en su Conferencia anual de desarrolladores de E/S esta semana.
Sin embargo, al igual que muchas de las otras herramientas de inteligencia artificial recientemente anunciadas, el nuevo generador de video aún no está disponible para uso público. Google tiene planes de permitir que artistas y creadores prueben la herramienta mediante ejercicios colaborativos, que pueden ayudar a mejorarla. Esto es lo que aprendimos sobre Google Veo.
¿Qué puede hacer Veo?
Google Veo puede generar videos de 1080p que duran más de un minuto y también puedes editarlos mediante instrucciones escritas. Puede garantizar que los fotogramas sean visualmente consistentes y que los usuarios puedan utilizar un único mensaje o una serie de mensajes que creen una narrativa. La herramienta puede incluir efectos cinematográficos como tomas aéreas y crear escenas muy detalladas.
Puedes optar por el realismo, el surrealismo e incluso la animación al crear vídeos con Veo. Además de esto, te permite utilizar comandos cinematográficos y comprende términos como «toma aérea» y «timelapse». En comparación con los generadores de video de IA anteriores que Google anunció, Veo ofrece un mayor control y ofrece videos de mejor calidad.
Veo también admite la edición enmascarada, que te permite realizar ajustes en secciones específicas del vídeo. Puede hacerlo incluyendo un área de máscara en el mensaje, y también se pueden usar imágenes junto con mensajes de texto para generar videos.
En tal caso, utilizará la imagen proporcionada como referencia y generará un video con el mismo estilo, como el siguiente video que se generó usando una imagen de alpacas con suéteres tejidos y el mensaje Alpacas dancing to the beat
.
¿Cómo funciona Veo?
Los modelos de vídeo con IA deben comprender correctamente las indicaciones que se les proporcionan y combinar esa información con las referencias disponibles. Veo ha sido diseñado para ser excepcionalmente bueno en la comprensión del lenguaje natural y las imágenes, lo que le permite generar videos con precisión, incluidos aquellos con varios detalles.
Debido a esto, un mensaje como Timelapse of a common sunflower opening, dark background
puede proporcionarle un video de muy alta calidad.
Según Google, Veo mejora otras herramientas de generación de vídeo anunciadas anteriormente por la empresa, como Lumiere, VideoPoet, WALT, etc., mediante el uso de vídeos latentes comprimidos. A diferencia de estas herramientas, Veo está capacitado para utilizar subtítulos de video detallados, lo que ayuda a la IA a comprender mejor las indicaciones.
Google afirma que el generador de vídeo se basa en transformadores de difusión latente, lo que garantiza la coherencia y evita que los personajes y objetos parpadeen y salten entre escenas. También utiliza latentes, que son representaciones comprimidas de vídeo que lo hacen más eficiente y ayudan a mejorar el rendimiento. Gracias a esto, Veo puede generar vídeos de alta calidad en menos tiempo.
Los videos que genere usando Veo tendrán una marca de agua usando SynthID de Google, que utiliza para identificar contenido generado por IA, similar a lo que hace Sora de OpenAI a través del estándar Coalition for Content Provenance and Authenticity (C2PA).
Además, existen procesos de verificación de memorización y filtros de seguridad para ayudar a reducir los riesgos de prejuicios, derechos de autor y privacidad. A pesar de estas tecnologías y procesos, Veo todavía necesita algunas mejoras, ya que los fondos todavía tienden a cambiar y las áreas muy detalladas no parecen estar muy bien juntas. Por eso, Google sólo permite que unos pocos creadores lo prueben.
¿Cómo se puede utilizar Veo?
Como se mencionó anteriormente, Veo no está disponible actualmente para uso público y Google solo permite que unos pocos creadores selectos prueben la herramienta. Pueden probarlo usando VideoFX, otra herramienta experimental disponible en Google Labs, donde están presentes todos los productos de Google que están en prueba.
Si eres un creador y quieres probar Veo,
- Visite el sitio web de Google Labs para unirse a la lista de espera.
- Introduce tus datos y envíalos.
- Espere a que Google verifique su envío. Si lo considera adecuado, se le permitirá probar Veo.
Google Veo es el último de una larga lista de generadores de video impulsados por inteligencia artificial anunciados por Google y parece ser el más poderoso hasta el momento. No solo te permite crear videos usando diferentes estilos y efectos, sino también editar videos creados fácilmente.
Hemos explicado cómo los creadores pueden unirse a la lista de espera y probar la herramienta por sí mismos, pero no se sabe si Veo se lanzará públicamente. Google sólo ha insinuado que algunas de las capacidades de la herramienta podrían incluirse en cortos de YouTube, así que eso es algo que esperamos con ansias.
Deja una respuesta