La carrera por la IA para video sumó un competidor que, por su tamaño, no debería inquietar a las grandes tecnológicas. Sin embargo, Video Rebirth, una startup con base en Singapur, oficina en Hong Kong y apenas 30 personas en su equipo, ya captó la atención de fondos vinculados a AMD, Hyundai Motor Group, CJ Group y otros jugadores asiáticos. Su objetivo es usar la generación de video como base para construir mundos 3D interactivos en tiempo real.
La compañía cerró en marzo una ronda inicial por US$ 80 millones, sin revelar su valuación. En esa lista de inversores figuran AMD Ventures, el brazo de capital de riesgo de Advanced Micro Devices, y ZER01NE, el vehículo de inversión de Hyundai Motor Group. También participaron Hiven, Actoz Soft, Qiming Venture Partners y Gaw Capital. Para una empresa con menos de dos años de vida, el respaldo la ubicó en una liga donde los costos de cómputo suelen dejar fuera de juego a los más chicos.
El producto que empujó ese salto se llama Bach.
Se trata del modelo principal de Video Rebirth y debutó en mayo en el sexto puesto del ranking de texto a video de Artificial Analysis. Quedó por detrás de desarrollos de Alibaba, ByteDance, Kuaishou Technology y xAI, pero con un dato que marca la diferencia. Fue el modelo de startup mejor ubicado y, entre los diez primeros, ofreció el precio por minuto de video generado más bajo.
Bach apunta a clientes corporativos de publicidad, entretenimiento, cine y videojuegos. Su función más llamativa permite crear videos de varias tomas de hasta 45 segundos a partir de imágenes de referencia y textos. En comparación, Seedance 2.0 de ByteDance, uno de los modelos más conocidos para video con IA de varias tomas, tiene un límite de 15 segundos, aunque acepta video y audio como entrada.
Índice de temas
La apuesta detrás de Bach
El negocio de la IA generativa para video requiere mucho más dinero que el de los modelos de texto. Entrenar sistemas avanzados puede costar decenas de millones de dólares y operarlos a escala demanda una infraestructura todavía más cara. Esa presión quedó a la vista con Sora, la plataforma de OpenAI, que según estimaciones citadas por Forbes consumía cerca de US$ 15 millones diarios para producir millones de videos de 10 segundos a pedido de sus usuarios.
Liu asegura que Bach corre con una estructura mucho más eficiente. No detalló el costo exacto por confidencialidad, aunque afirmó que generar un clip de 10 segundos resulta “significativamente inferior” frente a otros modelos de primera línea. La empresa atribuye esa ventaja a una tecnología propia que puede acelerar hasta 10 veces el proceso de creación de video.
La técnica, llamada pérdida de muestreo multietapa, entrena al modelo para anticipar y corregir errores durante la creación del material. Así reduce la cantidad de pasos necesarios para llegar al video final. En los modelos tradicionales esa falta de anticipación encarece el proceso y aumenta el tiempo de ejecución.
La eficiencia también aparece en el entrenamiento. Bach usó menos videos, pero de mayor calidad, entre ellos películas y videoclips con licencia, además de piezas grabadas por el propio equipo. La mayoría del material tuvo resolución de 720p. La arquitectura separa el seguimiento de eventos de la generación visual, una división que, según la compañía, mejora el uso del cómputo.

Esa combinación le permitió a Video Rebirth entrar en una discusión dominada por gigantes. Su desafío consiste en demostrar que el ahorro no sacrifica calidad, coherencia ni realismo físico.
Mundos 3D, autos autónomos y robots
La ambición mayor se llama Olympus. Es el modelo del mundo que Video Rebirth planea lanzar hacia fines de 2026. La idea es que funcione de manera similar a Genie 3, el sistema de Google que permite generar entornos navegables a partir de instrucciones de texto. La diferencia estará en la incorporación de sonidos ambientales, como impactos, pasos o choques.
Un modelo del mundo busca entender propiedades físicas y simular qué ocurre después en una escena, incluso ante situaciones que no vio antes. La promesa excede al entretenimiento. Puede servir para entrenar autos autónomos ante eventos raros, enseñar a robots a operar con mayor precisión y acelerar el desarrollo de videojuegos sin depender de procesos tradicionales de simulación.
Un fundador que salió de Tencent
La historia de Liu ayuda a explicar por qué la ronda atrajo capital. Antes de crear Video Rebirth, fue científico distinguido en Tencent, una categoría reservada para investigadores de alto nivel. Allí lideró el desarrollo del modelo de IA Hunyuan. En septiembre de 2024, dejó ese puesto para fundar la startup junto con Li Difu, exdirector del Tencent AI Lab, Liu Peng, exdesarrollador cuantitativo de JPMorgan Chase, y Dan Kong, exdirector de 42X Fund.
Su interés por los modelos del mundo tomó fuerza a comienzos de 2024, cuando OpenAI presentó Sora y lo describió como un simulador del mundo. Para Liu, los grandes modelos de lenguaje ya estaban ocupados por empresas con presupuestos enormes. La IA física, en cambio, ofrecía un terreno más abierto, aunque con dificultades técnicas profundas.
El propio Liu reconoce que la adopción masiva no será inmediata. Cree que los próximos 12 meses estarán marcados por avances de laboratorio, más que por ingresos explosivos. Esa prudencia contrasta con la escala de su objetivo, pero también muestra una lectura realista del mercado. Los modelos del mundo todavía no alcanzan la precisión ni el costo necesarios para un despliegue amplio en todas las industrias.
La oportunidad, de todos modos, es demasiado grande para ignorarla. Google, Meta, OpenAI, Nvidia, Alibaba, Runway y World Labs trabajan en la misma dirección. Frente a ellos, Video Rebirth apuesta por velocidad, costos bajos y control de escenas. Con US$ 80 millones en caja y una nueva ronda prevista para julio, la startup quiere probar que un equipo chico puede competir en una de las fronteras más caras de la inteligencia artificial.
El resultado de esa apuesta no se medirá solo por videos más atractivos. Si Olympus cumple con lo prometido, Video Rebirth podría pasar de crear clips a ofrecer simulaciones útiles para industrias enteras. Esa es la diferencia entre una herramienta creativa y una tecnología capaz de entrenar máquinas para actuar en el mundo físico.








