하나의 통합 모델로 텍스트, 이미지, 동영상 참조를 활용하여 동영상을 생성하고 편집하세요
Kling 3.0 Omni는 텍스트, 이미지, 동영상을 입력으로 받는 통합 멀티모달 동영상 모델입니다. 텍스트-투-비디오, 이미지-투-비디오, 참조 기반 생성, 동영상 편집을 네이티브 오디오 출력과 함께 하나의 파이프라인으로 통합합니다.
텍스트 프롬프트, 참조 이미지(최대 7장), 기존 동영상 클립을 하나의 모델에 입력할 수 있습니다.
참조 클립을 제공하고 자연어로 변경 사항을 설명하여 기존 동영상을 편집합니다.
참조 이미지를 사용하여 여러 샷과 장면에서 동일한 캐릭터 외형을 유지합니다.
참조 이미지나 동영상의 비주얼 스타일을 생성 콘텐츠에 적용합니다.
텍스트 프롬프트로 시작하거나, 스타일 일관성을 위한 참조 이미지를 업로드하거나, 편집할 동영상을 제공하세요.
캐릭터 또는 스타일 일관성을 위해 최대 7장의 참조 이미지를 업로드하세요. 동영상 편집을 위해 참조 동영상(3-10초, 최대 200MB)을 추가하세요.
Standard 또는 Pro 모드, 화면 비율(16:9, 9:16, 1:1), 길이(3-15초), 오디오 생성 여부를 선택하세요.
모델이 모든 입력을 함께 처리하여 선택적 동기화 오디오와 함께 동영상을 출력합니다.
캐릭터 외형과 비주얼 스타일을 안내하기 위해 최대 7장(동영상과 함께 사용 시 4장)의 참조 이미지를 업로드하세요.
참조 동영상을 제공하고 편집 내용을 설명하세요. 모델이 모션을 보존하면서 변경 사항을 적용합니다.
'Feature' 모드는 스타일 전환용이고, 'Base' 모드는 모션을 보존하면서 직접 동영상을 편집하는 용도입니다.
전체 시퀀스에서 일관된 캐릭터로 최대 6개의 연결된 샷을 만들 수 있습니다.
대화, 효과음, 환경음을 포함한 동기화된 오디오를 생성합니다.
동영상 편집 시 참조 클립의 원본 오디오 트랙을 선택적으로 유지할 수 있습니다.
모드 선택에 따른 초당 과금 방식입니다.
초당 $0.112. 10초 동영상 비용은 $1.12입니다.
초당 $0.168, 더 높은 품질의 출력. 10초 동영상 비용은 $1.68입니다.
참조 기반 제어나 동영상 편집 기능이 필요할 때 Omni가 적합합니다.
브랜드 참조 이미지를 업로드하여 캠페인 전반에 걸쳐 비주얼 아이덴티티에 맞는 동영상을 생성하세요.
피사체의 참조 이미지를 제공하여 여러 장면에서 동일한 캐릭터를 유지하세요.
원본 모션과 타이밍을 유지하면서 기존 영상을 다른 비주얼 스타일로 변환하세요.
동일한 참조에서 다른 스타일이나 설정으로 여러 버전의 제품 동영상을 생성하세요.
Next-generation AI video model — Coming Soon
Native 4K, multi-shot sequencing & integrated audio
Transfer motion from reference video to image
Natural language video editing with motion preservation
Talking head generation with audio lip-sync at 48fps
Cinematic motion with native audio & lip-sync
Motion path control with up to 6 independent elements
Ultra-fast photorealistic image generation