reference-audio
-
Seedance 2.0 fast가 만든 영상의 입 모양이 어색했다 — lip-sync가 production 디폴트가 된 이유IT 2026. 5. 22. 22:00
📡 이 글은 BytePlus Seedance 2.0 fast 모델을 API로 직접 호출해서 영상을 만드는 사용자를 위한 글입니다. generate_audio 토글과 reference_audio role을 직접 다루는 시나리오는 API 사용자만 해당됩니다. ModelArk 콘솔에서 음성을 같이 업로드해 보신 분이라면 결과는 비슷하게 보이지만, 본문에서 다루는 ffmpeg post-mux와의 trade-off 결정은 API 자동화 환경에서 의미가 있습니다."AI로는 무음 영상만 생성하고 음성은 내가 mux한다" — 처음의 가정처음 영상 파이프라인을 설계할 때 자연스럽게 떠오른 패턴이 하나 있었습니다.Seedance는 시각만 잘하니까 영상은 무음으로 생성시키자(generate_audio: false).그 다..