Videos aus Text, Bildern und Videoreferenzen in einem einheitlichen Modell generieren und bearbeiten
Kling 3.0 Omni ist ein einheitliches multimodales Videomodell, das Text, Bilder und Videos als Eingabe akzeptiert. Es vereint Text-zu-Video, Bild-zu-Video, referenzbasierte Generierung und Videobearbeitung in einer einzigen Pipeline mit nativer Audioausgabe.
Geben Sie Textprompts, Referenzbilder (bis zu 7) und vorhandene Videoclips in ein Modell ein.
Bearbeiten Sie vorhandene Videos, indem Sie einen Referenzclip bereitstellen und Aenderungen in natuerlicher Sprache beschreiben.
Behalten Sie das gleiche Erscheinungsbild einer Figur ueber mehrere Aufnahmen und Szenen hinweg mithilfe von Referenzbildern bei.
Wenden Sie visuelle Stile aus Referenzbildern oder -videos auf Ihre generierten Inhalte an.
Beginnen Sie mit einem Textprompt, laden Sie Referenzbilder fuer Stilkonsistenz hoch oder stellen Sie ein Video zur Bearbeitung bereit.
Laden Sie bis zu 7 Referenzbilder fuer Charakter- oder Stilkonsistenz hoch. Fuegen Sie ein Referenzvideo (3-10s, max. 200MB) zur Videobearbeitung hinzu.
Waehlen Sie Standard oder Pro Modus, Seitenverhaeltnis (16:9, 9:16, 1:1), Dauer (3-15s) und ob Audio generiert werden soll.
Das Modell verarbeitet alle Eingaben zusammen und gibt ein Video mit optionalem synchronisiertem Audio aus.
Laden Sie bis zu 7 Referenzbilder hoch (4 in Kombination mit Video), um das Erscheinungsbild und den visuellen Stil zu steuern.
Stellen Sie ein Referenzvideo bereit und beschreiben Sie die Aenderungen. Das Modell bewahrt die Bewegung und wendet Ihre Aenderungen an.
Verwenden Sie den Feature-Modus fuer Stiltransfer oder den Base-Modus fuer direkte Videobearbeitung mit Bewegungserhaltung.
Erstellen Sie bis zu 6 verbundene Aufnahmen mit konsistenten Charakteren ueber die gesamte Sequenz.
Generieren Sie synchronisiertes Audio einschliesslich Dialoge, Soundeffekte und Umgebungsgeraeusche.
Behalten Sie bei der Videobearbeitung optional die Original-Audiospur Ihres Referenzclips bei.
Sekundenbasierte Preisgestaltung je nach Modus.
$0,112 pro Sekunde. Ein 10-Sekunden-Video kostet $1,12.
$0,168 pro Sekunde mit hoeherer Ausgabequalitaet. Ein 10-Sekunden-Video kostet $1,68.
Omni ist die richtige Wahl, wenn Sie referenzbasierte Kontrolle oder Videobearbeitungsfunktionen benoetigen.
Laden Sie Marken-Referenzbilder hoch, um Videos zu generieren, die Ihrer visuellen Identitaet ueber Kampagnen hinweg entsprechen.
Behalten Sie denselben Charakter ueber mehrere Szenen bei, indem Sie Referenzbilder Ihres Motivs bereitstellen.
Verwandeln Sie vorhandenes Filmmaterial in verschiedene visuelle Stile und bewahren Sie dabei die urspruengliche Bewegung und das Timing.
Generieren Sie mehrere Versionen von Produktvideos mit verschiedenen Stilen oder Einstellungen aus derselben Referenz.
Videos mit multimodalen Referenzen und Stilkontrolle generieren und bearbeiten.
Next-generation AI video model — Coming Soon
Native 4K, multi-shot sequencing & integrated audio
Transfer motion from reference video to image
Natural language video editing with motion preservation
Talking head generation with audio lip-sync at 48fps
Cinematic motion with native audio & lip-sync
Motion path control with up to 6 independent elements
Ultra-fast photorealistic image generation