Sora 2 es el creador de vídeos de IA de OpenAI consistentemente inconsistente

Donde la mayoría de los modelos de vídeo de IA tienen problemas con la continuidad, Sora 2 entiende la causa y el efecto del entorno. Las sombras se desplazan de forma realista. El agua ondea cuando algo se mueve cerca de ella. Los reflejos aparecen en cristales y charcos, no en ángulos aleatorios.
OpenAI describe Sora 2 como capaz de generar "escenas complejas con múltiples personajes, movimiento específico y fondos detallados que permanecen consistentes a lo largo del tiempo" Es cierto, aunque "consistente" sigue siendo un término relativo en este mundo.
Prompt 1: El duelo de Central Park que se vino abajo
La primera prueba era deliberadamente ambiciosa:
"Una apacible tarde en el Central Park de Nueva York. Los turistas pasean bajo la suave luz del sol. De repente, una figura con túnica activa un bastón de energía resplandeciente e insta a la gente a ponerse a salvo. Otra, con túnicas oscuras, emerge de entre los árboles empuñando un arma roja. La multitud se dispersa mientras los dos se baten en duelo, con movimientos de danza, arcos de luz resplandecientes que se reflejan en el agua cercana. La cámara los rodea continuamente mientras las hojas de otoño se arremolinan en el aire"
Lo que salió fue visualmente impactante: suaves tonos dorados, rotación suave de la cámara y reflejos convincentes. Pero entonces llegó el caos. Los báculos brillantes (sables de luz) parpadeaban, se doblaban y se transformaban en formas extrañas. Los cuerpos de los luchadores perdieron el equilibrio, los miembros se entrecruzaban como polígonos fantasmales de un videojuego de los 90. La coreografía derivó hacia una danza interpretativa surrealista más que hacia un combate cinematográfico.
Y este fallo no es exclusivo de mi prueba. OpenAI ha reconocido que Sora 2 "tiene dificultades con el combate humanoide sostenido y físicamente plausible o con la coreografía de armas", una limitación que se hace evidente rápidamente una vez que las armas empiezan a moverse.
Aun así, el mundo circundante parecía lo bastante real como para que casi se pudiera perdonar. La escena parecía cinematográfica, aunque la acción no lo fuera.
Prompt 2: La redención del duelo de Central Park
Sora 2 respondió bastante bien al siguiente prompt.
"Una tarde tranquila en el Central Park de Nueva York. Los turistas pasean y hacen fotos bajo la suave luz dorada del sol. De repente, una figura con túnicas claras activa un bastón de energía resplandeciente y pide urgentemente a la gente que se ponga a salvo. Otra figura con túnicas oscuras aparece de entre los árboles, sosteniendo un arma de energía roja. La multitud se dispersa cuando ambos inician un duelo preciso y cinematográfico: movimientos elegantes y danzantes, arcos de luz resplandecientes que se reflejan en el agua cercana. La cámara los rodea en un plano continuo mientras las hojas de otoño se arremolinan en el aire. No se muestra ningún contacto ni lesión, sólo una hábil coreografía y un movimiento dinámico".
Esta vez, funcionó de verdad. Los movimientos parecían fundados, fluidos y sorprendentemente humanos, con un golpe final que fluye con tanta naturalidad que es fácil olvidar que se está viendo algo generado por la IA.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck
Prompt 3: Pájaros y leones en un abrevadero
Para una prueba más tranquila, recurrí a la fauna salvaje. El prompt:
"Cree una escena de vida salvaje en la que pájaros y leones estén bebiendo de forma natural en un abrevadero. Cada animal debe moverse de forma realista y la escena debe ser hiperrealista"
Aquí, Sora 2 estaba en su elemento. Los pájaros revoloteaban y se sumergían con un movimiento de alas creíble. La luz del sol brillaba en la superficie del agua, y los reflejos respondían con naturalidad cuando los animales cambiaban de posición. Las texturas -pelo, plumas, barro ondulante- parecían cercanas a la calidad documental de la naturaleza.
Sin embargo, los caprichos de la modelo seguían apareciendo. Un león acabó torpemente colocado en el borde fangoso, pareciendo que bebía directamente de la suciedad y no del agua. Es un detalle menor pero revelador: Sora 2 clava la escena general, pero a veces pierde la noción de la interacción objeto-superficie.
Aun así, éste fue fácilmente el resultado más convincente, y un indicio de dónde reside la verdadera fuerza de Sora 2: el realismo medioambiental.
Prompt 4: La persecución futurista en la azotea
Para la prueba final, llevé al límite el movimiento, la iluminación y la atmósfera:
"Un extenso paisaje urbano futurista al amanecer. Un mensajero ciberpunk con una chaqueta oscura corre por los tejados, portando un maletín de datos resplandeciente. Un dron perseguidor serpentea entre antenas y conductos de ventilación, con los propulsores encendidos en azul.
La cámara sigue desde detrás y a la derecha del corredor, estilo cámara en mano, mientras saltan un hueco. El dron se adelanta en pleno vuelo; los destellos del objetivo y el desenfoque de movimiento completan la escena"
El resultado fue impresionante y sorprendentemente cinematográfico.
La iluminación convenció: el brillo del amanecer en las torres de cristal, los reflejos en las superficies metálicas y el sutil destello del objetivo durante el salto. El movimiento parecía fluido y con peso. La persecución con drones introdujo una tensión genuina, mientras que la escasa profundidad de campo imitaba a una cámara de cine de 35 mm.
Esto era Sora 2 disparando con todos los cilindros: complejo, cohesivo y creíble. Si esto se hubiera lanzado como un teaser para un juego o una película, la mayoría de los espectadores no sospecharían de la participación de la IA a primera vista.
La hermosa imprevisibilidad de Sora 2
A lo largo de estas pruebas, una verdad sobresalió: Sora 2 es consistentemente inconsistente. A veces, lo hace todo bien. Otras veces, da a luz algo tan bizarro que no puedes parar de reír. Esa imprevisibilidad se ha convertido en parte de su encanto.
En Reddit, un usuario lo resumió a la perfección:
"Sora 2 o te da Pixar o energía de sueño febril, nada intermedio".
- r/AIGuild
En ocasiones, el modelo distorsiona los objetos, cambia de color en mitad de la escena o malinterpreta las indicaciones de formas deliciosamente absurdas. Una vez, una petición de "dos animales de peluche caminando uno al lado del otro" produjo criaturas que parecían mitad osito de peluche, mitad globo hinchable. No es exacto, pero es memorable.
Ese caos puede ser un lastre para los profesionales que necesitan fiabilidad, pero para la experimentación creativa, es oro. Sora 2 actúa a veces más como un colaborador con una imaginación hiperactiva que como una máquina predecible.
Realismo frente a realidad: Comprender los puntos fuertes de Sora 2
Cuando Sora 2 funciona, parece magia. Pero no es magia: es una máquina que interpreta sus palabras mediante el aprendizaje de probabilidades y patrones visuales. Se nutre del contexto, no de la precisión. Déle un fuerte sentido del lugar -dirección de la iluminación, movimiento de la cámara, tono- y rellenará el resto de forma convincente. Pídale una coreografía basada en la precisión o una interacción motora fina, y vacilará.
El patrón coincide con lo que otros han observado en los grupos de pruebas de Reddit y Discord. Los creadores observan que las acciones humanas más sencillas (caminar, mirar, gesticular) son creíbles, pero las secuencias complejas (luchar, abrazarse, tocar instrumentos) se vienen abajo rápidamente. Eso sugiere que el modelado físico de OpenAI sigue tratando el cuerpo humano como un conjunto de grupos de movimientos independientes en lugar de como una sola unidad. Es lo suficientemente realista durante unos segundos, pero luego la entropía se apodera de todo.
El contexto más amplio: La creatividad en la era de los algoritmos
Lo que hace fascinante a Sora 2 no es sólo su progreso técnico... Es el cambio cultural que representa.
Durante décadas, la creación de vídeos era cara, requería mucho tiempo y estaba limitada por el acceso a los equipos o el talento. Ahora, cualquiera con una buena idea y un párrafo de texto puede producir algo visualmente convincente.
Esa democratización es poderosa, pero también difumina la autoría creativa. Cuando una modelo "imagina" parte de una escena de forma incorrecta, ¿se trata de un fallo o de una interpretación?
En mi duelo de Central Park, las armas deformadas arruinaron el realismo pero introdujeron una cualidad onírica. No era lo que yo quería, pero insinuaba una estética surrealista y pictórica, algo más cercano al cine experimental que a la acción de Hollywood.
Quizá ésa sea la lección más profunda: El cine de IA no trata sobre el control. Se trata de negociación.
Límites técnicos y éticos
OpenAI es consciente tanto del entusiasmo como del malestar que rodean a esta herramienta. La empresa sigue limitando el acceso, alegando un posible uso indebido y la necesidad de salvaguardar los contenidos.
El gobierno japonés instó recientemente a OpenAI a que se asegure de que Sora 2 no infringe los derechos de autor del anime y el manga, un recordatorio de que el alcance creativo de la IA conlleva consecuencias legales en el mundo real. Luego está la cuestión de la originalidad. Puede que los resultados de Sora 2 parezcan nuevos, pero están entrenados a partir de grandes cantidades de medios existentes. Cuanto más realista se vuelve, más difícil resulta separar el homenaje de la réplica. Por eso, a pesar de su maravilla, Sora 2 se encuentra en una encrucijada entre el arte y la automatización.
Los problemas de audio son muy notables
La mayoría de los clips de Sora 2 siguen teniendo problemas con el sonido. Mientras que los efectos visuales son a menudo impresionantes, el audio tiende a sonar pobre, plano, apagado o poco natural. El Sora 2 intenta generar ruido ambiental, efectos y diálogos a la vez, pero no puede separarlos como lo haría un verdadero diseñador de sonido. El resultado es un audio sobrecomprimido, metálico o extrañamente equilibrado que rara vez está a la altura de la calidad cinematográfica de los efectos visuales. Por ahora, la mejor forma de hacer que los vídeos de Sora 2 suenen bien es añadir sonido en la posproducción, superponiendo el ambiente, los efectos y la música del mundo real para dar vida a la escena.
Un vistazo al futuro, imperfectamente renderizado
Tras días de pruebas, Sora 2 me dejó impresionado, divertido y un poco inquieto. Es a la vez una maravilla de la ingeniería y un recordatorio de que el movimiento humano, la emoción y la narración siguen siendo singularmente complejos.
Puntos fuertes: Entornos, iluminación, atmósfera, movimiento dinámico y realismo en secuencias cortas.
Puntos débiles: El contacto humano, la física de las armas, las distorsiones surrealistas ocasionales.
¿Resulta realmente eficaz Sora 2?
Sora 2 es un paso bastante decente hacia la cinematografía asistida por IA... Sólo que aún no espere un realismo impecable. Además, los verdaderos cineastas siguen siendo los verdaderos artistas que necesitamos... Ya que a Sora 2 aún le cuesta mover el antimonio de un ser humano, así como de los animales, de forma natural.
Como dijo un Redditor
"Sora 2 se siente como ver al futuro aprender a soñar".
- r/OpenAI
Es un resumen apropiado. Sora 2 no sólo simula la realidad... Experimenta con ella. Y para los que estamos viendo cómo se desarrolla, eso es a la vez emocionante y profundamente humano... Sólo que con una calidad de audio extremadamente mala.




