Cinematic video from references
Seedance 2.0 Fast Reference to Video er ByteDances mest avanserte videogenereringsmodell, spesialbygget for skapere som trenger kinokvalitetsvideo med rik, synkronisert lyd — alt generert fra en fleksibel kombinasjon av tekstprompter, referansebilder, referansevideoer og til og med lydinnganger. Uansett om du er en filmskaper som forhåndsviser en scene, en designer som animerer et konsept, eller en innholdsskaper som produserer rullestoppende sosiale medier-klipp, gir denne modellen regissørnivå kontroll over din visuelle fortelling.
Kjernen i Seedance 2.0 Fast Reference to Video er å transformere din kreative visjon til polert videooutput med realistisk fysikk, naturlig bevegelse og innebygd lydgenerering. Det som skiller den ut, er det multimodale referansesystemet: du kan levere opptil ni referansebilder, opptil tre referansevideoer og opptil tre lydfiler, og veve dem direkte inn i tekstprompten din for å styre genereringen. For eksempel kan du laste opp et karakterportrett, et bakgrunnsmiljøbilde og en voiceover-klipp, og deretter skrive en prompt som forteller modellen nøyaktig hvordan de skal kombineres — ved å referere til hver inngang naturlig i beskrivelsen din. Dette gjør det til et ekstraordinært kraftfullt verktøy for å bringe storyboards til live, skape stilisert animasjon og produsere leppe-synkroniserte snakkende hode-videoer.
Modellens innebygde lydgenerering er aktivert som standard og produserer synkroniserte lydeffekter, omgivelseslydlandskap og leppe-synkronisert tale som matcher den visuelle handlingen på skjermen. Dette betyr at dine genererte videoer kommer klare til bruk — ingen behov for å skaffe eller manuelt synkronisere lyd i etterproduksjon. Hvis du foretrekker en stille video eller planlegger å legge til din egen lydspor, kan du bare slå av lydgenereringen.
Seedance 2.0 tilbyr et allsidig spekter av kreative kontroller som lar deg forme outputen etter dine eksakte behov. Du kan velge blant sju aspect ratio-alternativer: 16:9 for standard landskap og bredskjerminnhold, 9:16 for vertikale og portrettorienterte videoer perfekte for sosiale plattformer som TikTok eller Instagram Reels, 1:1 for kvadratiske formater, 4:3 og 3:4 for klassiske og høye komposisjoner, 21:9 for ultrabred kinematiske formater ideelle for filmstilsekvenser, eller auto for å la modellen intelligent bestemme basert på prompten din. Videolengde er like fleksibel, fra 4 til 15 sekunder, med et auto-alternativ som lar modellen bestemme ideell lengde basert på narrativet i prompten din. Oppløsning kan settes til 720p for balanse mellom kvalitet og genereringshastighet, eller 480p når du vil ha raskere resultater — nyttig for rask iterasjon og forhåndsvisning av ideer før du forplikter deg til en endelig rendering.
Referansebasert arbeidsflyt er der denne modellen virkelig skinner for kreative profesjonelle. Ved å laste opp referansebilder (JPEG, PNG eller WebP, opptil 30 MB hver), kan du styre modellens visuelle stil, karakterutseende eller scene-komposisjon. Referansevideoer (MP4 eller MOV, med kombinert lengde mellom 2 og 15 sekunder) lar deg gi bevegelsesreferanser, tempoindikasjoner eller eksisterende opptak å bygge videre på. Referanselydfiler (MP3 eller WAV, opptil 15 sekunder kombinert) kan drive leppe-synk-animasjon eller sette den soniske tonen for en scene — selv om lydinnganger krever minst ett referansebilde eller -video sammen med dem. Du kan kombinere opptil 12 filer totalt på tvers av alle inngangstyper, noe som gir deg enorm kreativ frihet. I prompten din refererer du bare til disse inngangene ved å bruke naturlige tags som @Image1, @Video2 eller @Audio1 for å fortelle modellen hvordan hver referanse skal påvirke den endelige outputen.
Denne modellen er spesielt godt egnet for karakteranimasjon, visuell effekt-previsualisering, musikkvideokonsepter, produktdemonstrasjoner, sosiale medier-innhold og narrative kortfilmer. Styrkene dens i stilisert innhold, transformasjon og leppe-synk-funksjoner gjør den til et fremragende valg for skapere som jobber på tvers av disse sjangrene. Den realistiske fysikksimuleringen betyr at objekter faller, vann renner og karakterer beveger seg med troverdig vekt og momentum, noe som gir en kinematisk polering som løfter generert innhold utover typisk AI-video.
For reproduserbarhet kan du sette en seed-verdi for å generere lignende resultater på tvers av flere kjøring, noe som er nyttig når du itererer på et konsept og ønsker konsistente outputs. Merk at selv med samme seed kan det oppstå små variasjoner mellom genereringer.
Noen praktiske hensyn å ha i mente: referansevideoer bør være mellom ca. 480p og 720p oppløsning for best resultat. Enkelte bildefiler kan være opptil 30 MB, mens totalstørrelsen på alle videoreferanser bør holdes under 50 MB, og hver lydfil bør ikke være større enn 15 MB. Det totale antallet filer på tvers av bilder, videoer og lyd må ikke overstige 12. Å jobbe innenfor disse retningslinjene sikrer at modellen kan behandle referansene dine effektivt og levere høyest mulig kvalitet på outputen.
Seedance 2.0 Fast Reference to Video representerer et betydelig sprang i tilgjengelig, høykvalitets videogenerering. Den bringer sammen multimodal inngangsfleksibilitet, kinematisk visuell kvalitet, innebygd lyd med leppe-synk og intuitive kreative kontroller i ett kraftfullt kreativt verktøy — designet for skapere som krever profesjonelle resultater uten kompleksiteten i tradisjonelle produksjonsarbeidsflyter.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Beskriv videoscenen din med bevegelse, kameravinkler og stemning
Modellen lager filmatisk bevegelse med naturlig fysikk og lys
Last ned og del din produksjonsklare video
Demonstrerer modellens realistiske fysikksimulering og atmosfæriske dynamikk — rendering av troverdige værsystemer, dyrevennlighet og dramatiske miljøtransformasjoner med Netflix-kvalitets kinematisk språk og innebygd lyd.
Viser Seedance 2.0s presisjon med objekt-fysikk, væskedynamikk, makro-nivå detaljer og sømløse stilisert overganger — ideell for luksusprodukt-kinematografi med synkronisert foley og atmosfærisk lyd.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Bytt til resonneringsstyrt syntese i dag

Film-grade video with audio
0.1 kreditter

Fast balanced text-to-video generation
1.6 kreditter

High-quality, fast video generation
2 kreditter

Fast cinematic video with audio
0.1 kreditter

Character-driven video from references
2 kreditter

Cinematic video with native audio
1.4 kreditter

Fast, high-quality text-to-video
2.1 kreditter
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 kreditter
![Kling Video v3 Text to Video [Pro]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfd13%2Ft6TSkWzl6cFAzvO1PCdDu_f38263f637d245929f03881454951540.jpg&w=3840&q=75)
Cinematic video, fluid motion, audio
4 kreditter