Cinematic video from references
Seedance 2.0 Fast Reference to Video 是 ByteDance 最先進的影片生成模型,專為需要電影級品質影片並具備豐富同步音訊的創作者打造 — 全部從文字提示、參考圖像、參考影片,甚至音訊輸入的靈活組合生成。無論您是電影製作者預覽場景、設計師動畫化概念,或內容創作者製作吸引眼球的社群媒體短片,此模型都能提供導演級的視覺敘事控制。
Seedance 2.0 Fast Reference to Video 的核心,將您的創意願景轉化為具備真實物理、自然動作及原生音訊生成的精緻影片輸出。其獨特之處在於多模態參考系統:您可以提供最多九張參考圖像、最多三段參考影片,以及最多三個音訊檔案,然後直接將它們融入文字提示中來引導生成。例如,您可能上傳人物肖像、背景環境照片,以及語音旁白片段,然後撰寫提示告訴模型如何精確組合它們 — 在描述中自然引用每個輸入。這使其成為將故事板活化、創作風格化動畫,以及製作唇同步說話頭像影片的極強大工具。
模型的原生音訊生成預設啟用,能產生同步音效、環境音景,以及與畫面動作匹配的唇同步語音。這意味著您的生成影片立即可用 — 無需後製尋找或手動同步音訊。如果您偏好無聲影片或計畫加入自有音軌,只需關閉音訊生成即可。
Seedance 2.0 提供多樣創意控制,讓您精準塑造輸出。您可從七種畫面比例選擇:16:9 用於標準橫幅及寬銀幕內容,9:16 用於垂直及直式影片,完美適合 TikTok 或 Instagram Reels 等社群平台,1:1 用於方形格式,4:3 及 3:4 用於經典及高構圖,21:9 用於超寬電影格式,適合電影風格序列,或使用 auto 讓模型依提示智能決定。影片長度同樣靈活,從 4 至 15 秒,並有 auto 選項讓模型依提示敘事決定理想長度。解析度可設為 720p 以平衡品質與生成速度,或 480p 以獲得更快結果 — 適合快速迭代及預覽構想後再進行最終渲染。
基於參考的工作流程是此模型真正閃耀之處。透過上傳參考圖像(JPEG、PNG 或 WebP,每張最多 30 MB),您可引導模型的視覺風格、人物外貌或場景構圖。參考影片(MP4 或 MOV,總長 2 至 15 秒)讓您提供動作參考、節奏提示,或現有素材來建構。參考音訊檔案(MP3 或 WAV,總長最多 15 秒)可驅動唇同步動畫或設定場景音調 — 但音訊輸入需搭配至少一張參考圖像或影片。您可跨所有輸入類型組合最多 12 個檔案,提供極大創意自由。在提示中,只需使用如 @Image1、@Video2 或 @Audio1 等自然標籤引用這些輸入,即可告訴模型每個參考如何影響最終輸出。
此模型特別適合人物動畫、視覺效果預覽、音樂影片概念、產品示範、社群媒體內容及敘事短片。其在風格化內容、轉換及唇同步方面的強項,使其成為跨這些類型的創作者首選。真實物理模擬讓物件下落、水流動、人物以可信重量及動量移動,為生成內容增添電影級精緻度,超越典型 AI 影片。
為確保可重現性,您可設定種子值以在多次執行中產生相似結果,這在迭代構想並維持一致輸出時很有幫助。請注意,即使使用相同種子,生成間仍可能有細微變化。
幾點實用考量:參考影片解析度最好在 480p 至 720p 之間。單張圖像檔案最多 30 MB,所有影片參考總大小應低於 50 MB,每個音訊檔案不超過 15 MB。圖像、影片及音訊總檔案數不得超過 12。遵循這些指南可確保模型有效處理參考並交付最高品質輸出。
Seedance 2.0 Fast Reference to Video 代表易用高品質影片生成的重大躍進。它將多模態輸入靈活性、電影級視覺品質、原生唇同步音訊及直覺創意控制整合成單一強大工具 — 專為追求專業成果卻無傳統製作流程複雜度的創作者設計。
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
描述您的影片場景,包括動作、攝影機角度與氛圍
模型以自然物理與光線打造電影般的動作
下載並分享您的專業級影片
示範模型真實物理模擬及大氣動態 — 渲染可信天氣系統、動物動作及戲劇性環境轉換,具 Netflix 品質電影語言及原生音訊。
展現 Seedance 2.0 在物件物理、液體動態、微觀細節及無縫風格轉換的精準度 — 適合奢華產品電影攝影,同步 Foley 及環境音。
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
立即切換至推理引導合成

Cinematic video with native audio
1.4 點數

Fast cinematic video with audio
0.1 點數

Smooth, coherent AI video generation
2 點數

Fast, high-quality text-to-video
2.1 點數

Fast balanced text-to-video generation
1.6 點數

Stylish text-to-video generation
0.1 點數

Character-driven video from references
2 點數

Film-grade video with audio
0.1 點數
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 點數