Gere e edite videos a partir de texto, imagens e referencias de video em um modelo unificado
O Kling 3.0 Omni e um modelo de video multimodal unificado que aceita texto, imagens e video como entrada. Ele combina texto-para-video, imagem-para-video, geracao baseada em referencias e edicao de video em um unico pipeline com saida de audio nativa.
Alimente prompts de texto, imagens de referencia (ate 7) e clipes de video existentes em um unico modelo.
Edite videos existentes fornecendo um clipe de referencia e descrevendo as alteracoes em linguagem natural.
Mantenha a mesma aparencia do personagem em multiplas tomadas e cenas usando imagens de referencia.
Aplique estilos visuais de imagens ou videos de referencia ao seu conteudo gerado.
Comece com um prompt de texto, envie imagens de referencia para consistencia de estilo ou forneca um video para edicao.
Envie ate 7 imagens de referencia para consistencia de personagem ou estilo. Adicione um video de referencia (3-10s, max 200MB) para edicao de video.
Escolha o modo Standard ou Pro, proporcao de tela (16:9, 9:16, 1:1), duracao (3-15s) e se deseja gerar audio.
O modelo processa todas as entradas juntas e gera o video com audio sincronizado opcional.
Envie ate 7 imagens de referencia (4 quando combinadas com video) para guiar a aparencia do personagem e o estilo visual.
Forneca um video de referencia e descreva as edicoes. O modelo preserva o movimento enquanto aplica suas alteracoes.
Use o modo 'feature' para transferencia de estilo ou o modo 'base' para edicao direta de video com preservacao de movimento.
Crie ate 6 tomadas conectadas com personagens consistentes ao longo de toda a sequencia.
Gere audio sincronizado incluindo dialogos, efeitos sonoros e sons ambientes.
Ao editar video, mantenha opcionalmente a faixa de audio original do seu clipe de referencia.
Preco por segundo baseado na selecao de modo.
$0.112 por segundo. Um video de 10 segundos custa $1.12.
$0.168 por segundo com saida de maior qualidade. Um video de 10 segundos custa $1.68.
O Omni e a escolha certa quando voce precisa de controle baseado em referencias ou recursos de edicao de video.
Envie imagens de referencia da marca para gerar videos que correspondam a sua identidade visual em campanhas.
Mantenha o mesmo personagem em multiplas cenas fornecendo imagens de referencia do seu sujeito.
Transforme filmagens existentes em diferentes estilos visuais preservando o movimento e o tempo originais.
Gere multiplas versoes de videos de produto com diferentes estilos ou cenarios a partir da mesma referencia.
Gere e edite videos com referencias multimodais e controle de estilo.
Next-generation AI video model — Coming Soon
Native 4K, multi-shot sequencing & integrated audio
Transfer motion from reference video to image
Natural language video editing with motion preservation
Talking head generation with audio lip-sync at 48fps
Cinematic motion with native audio & lip-sync
Motion path control with up to 6 independent elements
Ultra-fast photorealistic image generation