Cinematic video from references
Seedance 2.0 Fast Reference to Video es el modelo de generación de vídeo más avanzado de ByteDance, diseñado específicamente para creadores que necesitan vídeos de calidad cinematográfica con audio rico y sincronizado — todo generado a partir de una combinación flexible de indicaciones de texto, imágenes de referencia, vídeos de referencia e incluso entradas de audio. Ya seas un cineasta previsualizando una escena, un diseñador animando un concepto o un creador de contenido produciendo clips para redes sociales que detienen el scroll, este modelo ofrece un control a nivel de director sobre tu narrativa visual.
En su núcleo, Seedance 2.0 Fast Reference to Video transforma tu visión creativa en una salida de vídeo pulida con física del mundo real, movimiento natural y generación de audio nativa. Lo que lo distingue es su sistema de referencias multimodales: puedes proporcionar hasta nueve imágenes de referencia, hasta tres vídeos de referencia y hasta tres archivos de audio, y luego integrarlos directamente en tu indicación de texto para guiar la generación. Por ejemplo, podrías subir un retrato de un personaje, una foto del entorno de fondo y un clip de voz en off, y luego escribir una indicación que le diga al modelo exactamente cómo combinarlos — refiriendo cada entrada de forma natural dentro de tu descripción. Esto lo convierte en una herramienta extraordinariamente potente para dar vida a storyboards, crear animaciones estilizadas y producir vídeos de cabezas parlantes con sincronización labial.
La generación de audio nativa está activada por defecto y produce efectos de sonido sincronizados, paisajes sonoros ambientales y habla sincronizada con los labios que coinciden con la acción visual en pantalla. Esto significa que tus vídeos generados llegan listos para usar — sin necesidad de buscar o sincronizar manualmente el audio en postproducción. Si prefieres un vídeo silencioso o planeas añadir tu propia pista de audio, simplemente puedes desactivar la generación de audio.
Seedance 2.0 ofrece una versátil gama de controles creativos que te permiten moldear la salida exactamente a tus necesidades. Puedes elegir entre siete opciones de relación de aspecto: 16:9 para contenido horizontal estándar y panorámico, 9:16 para vídeos verticales y en retrato perfectos para plataformas sociales como TikTok o Instagram Reels, 1:1 para formatos cuadrados, 4:3 y 3:4 para composiciones clásicas y altas, 21:9 para formatos ultrapanorámicos cinematográficos ideales para secuencias estilo cine, o auto para que el modelo decida inteligentemente en base a tu indicación. La duración del vídeo es igual de flexible, desde 4 hasta 15 segundos, con una opción auto que permite al modelo determinar la longitud ideal según la narrativa descrita en tu indicación. La resolución se puede establecer en 720p para un equilibrio entre calidad y velocidad de generación, o 480p cuando quieras resultados más rápidos — útil para iteraciones rápidas y previsualizar ideas antes de comprometerte con un render final.
El flujo de trabajo basado en referencias es donde este modelo brilla realmente para profesionales creativos. Al subir imágenes de referencia (JPEG, PNG o WebP, hasta 30 MB cada una), puedes guiar el estilo visual del modelo, la apariencia de los personajes o la composición de la escena. Los vídeos de referencia (MP4 o MOV, con una duración combinada entre 2 y 15 segundos) te permiten proporcionar referencias de movimiento, indicaciones de ritmo o material existente sobre el que construir. Los archivos de audio de referencia (MP3 o WAV, hasta 15 segundos combinados) pueden impulsar la animación de sincronización labial o establecer el tono sonoro de una escena — aunque las entradas de audio requieren al menos una imagen o vídeo de referencia junto con ellas. Puedes combinar hasta 12 archivos en total entre todos los tipos de entrada, dándote una enorme libertad creativa. Dentro de tu indicación, simplemente referencias estas entradas usando etiquetas naturales como @Image1, @Video2 o @Audio1 para indicarle al modelo cómo debe influir cada referencia en la salida final.
Este modelo es especialmente adecuado para animación de personajes, previsualización de efectos visuales, conceptos de vídeos musicales, demostraciones de productos, contenido para redes sociales y cortometrajes narrativos. Sus fortalezas en contenido estilizado, transformación y capacidades de sincronización labial lo convierten en una opción destacada para creadores que trabajan en estos géneros. La simulación de física del mundo real significa que los objetos caen, el agua fluye y los personajes se mueven con un peso y momentum creíbles, aportando un pulido cinematográfico que eleva el contenido generado más allá del vídeo AI típico.
Para reproducibilidad, puedes establecer un valor de seed para generar resultados similares en múltiples ejecuciones, lo que es útil al iterar en un concepto y querer salidas consistentes. Ten en cuenta que incluso con el mismo seed, pueden ocurrir ligeras variaciones entre generaciones.
Algunas consideraciones prácticas a tener en cuenta: los vídeos de referencia deben estar entre aproximadamente 480p y 720p de resolución para obtener los mejores resultados. Los archivos de imagen individuales pueden llegar hasta 30 MB, mientras que el tamaño total de todas las referencias de vídeo debe mantenerse por debajo de 50 MB, y cada archivo de audio no debe superar los 15 MB. El número total de archivos entre imágenes, vídeos y audio combinados no debe exceder 12. Trabajar dentro de estas directrices asegura que el modelo pueda procesar tus referencias de forma efectiva y entregar la salida de mayor calidad.
Seedance 2.0 Fast Reference to Video representa un avance significativo en la generación de vídeo accesible y de alta calidad. Combina la flexibilidad de entradas multimodales, calidad visual cinematográfica, audio nativo con sincronización labial y controles creativos intuitivos en una sola herramienta potente — diseñada para creadores que exigen resultados profesionales sin la complejidad de flujos de trabajo de producción tradicionales.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Describe tu escena de vídeo con movimiento, ángulos de cámara y estado de ánimo
El modelo crea movimiento cinematográfico con física e iluminación natural
Descarga y comparte tu vídeo listo para producción
Demuestra la simulación de física del mundo real del modelo y dinámicas atmosféricas — renderizando sistemas meteorológicos creíbles, movimiento animal y transformaciones ambientales dramáticas con lenguaje cinematográfico de calidad Netflix y audio nativo.
Muestra la precisión de Seedance 2.0 con física de objetos, dinámicas de líquidos, detalle macro y transiciones estilizadas fluidas — ideal para cinematografía de productos de lujo con foley sincronizado y audio atmosférico.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
¡Cambia hoy a la síntesis guiada por razonamiento!

Cinematic video with native audio
1.4 créditos

Fast cinematic video with audio
0.1 créditos

Film-grade video with audio
0.1 créditos

Character-driven video from references
2 créditos

Cinematic video from references
10 créditos

Smooth, coherent AI video generation
2 créditos
![Kling Video v3 Text to Video [Pro]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfd13%2Ft6TSkWzl6cFAzvO1PCdDu_f38263f637d245929f03881454951540.jpg&w=3840&q=75)
Cinematic video, fluid motion, audio
4 créditos

High-quality, fast video generation
2 créditos

Fast balanced text-to-video generation
1.6 créditos