lip-sync
-
Seedance 2.0 fast가 만든 영상의 입 모양이 어색했다 — lip-sync가 production 디폴트가 된 이유IT 2026. 5. 22. 22:00
📡 이 글은 BytePlus Seedance 2.0 fast 모델을 API로 직접 호출해서 영상을 만드는 사용자를 위한 글입니다. generate_audio 토글과 reference_audio role을 직접 다루는 시나리오는 API 사용자만 해당됩니다. ModelArk 콘솔에서 음성을 같이 업로드해 보신 분이라면 결과는 비슷하게 보이지만, 본문에서 다루는 ffmpeg post-mux와의 trade-off 결정은 API 자동화 환경에서 의미가 있습니다."AI로는 무음 영상만 생성하고 음성은 내가 mux한다" — 처음의 가정처음 영상 파이프라인을 설계할 때 자연스럽게 떠오른 패턴이 하나 있었습니다.Seedance는 시각만 잘하니까 영상은 무음으로 생성시키자(generate_audio: false).그 다..
-
t2v, i2v, flf2v, omni_reference — Seedance 2.0 fast 약어가 가리키는 것과 조합 매트릭스IT 2026. 5. 22. 21:00
📡 이 글은 BytePlus Seedance 2.0 fast 모델을 API로 직접 호출해서 영상을 만드는 사용자를 위한 글입니다. content array의 role을 직접 짜는 시나리오는 API 사용자에게만 해당됩니다. ModelArk 콘솔은 "Image-to-Video", "Reference-to-Video" 같은 UI 라벨로 task_type를 노출하므로 약어를 풀이할 일이 없습니다.약어가 너무 많다BytePlus Seedance API의 docs를 처음 펼치면 익숙하지 않은 약어들이 떠다닙니다. t2v, i2v, flf2v, omni_reference. 그리고 docs 어디엔가 흩어져 있는 generate_audio: true 같은 옵션. 어떤 건 직관적이고, 어떤 건 풀어 봐도 의미가 잘 안 ..