Videos aus Text, Bildern und Videoreferenzen in einem einheitlichen Modell generieren und bearbeiten








Kling 3.0 Omni ist ein einheitliches multimodales Videomodell, das Text, Bilder und Videos als Eingabe akzeptiert. Es vereint Text-zu-Video, Bild-zu-Video, referenzbasierte Generierung und Videobearbeitung in einer einzigen Pipeline mit nativer Audioausgabe.
Geben Sie Textprompts, Referenzbilder (bis zu 7) und vorhandene Videoclips in ein Modell ein.
Bearbeiten Sie vorhandene Videos, indem Sie einen Referenzclip bereitstellen und Aenderungen in natuerlicher Sprache beschreiben.
Behalten Sie das gleiche Erscheinungsbild einer Figur ueber mehrere Aufnahmen und Szenen hinweg mithilfe von Referenzbildern bei.
Wenden Sie visuelle Stile aus Referenzbildern oder -videos auf Ihre generierten Inhalte an.
Beginnen Sie mit einem Textprompt, laden Sie Referenzbilder fuer Stilkonsistenz hoch oder stellen Sie ein Video zur Bearbeitung bereit.
Laden Sie bis zu 7 Referenzbilder fuer Charakter- oder Stilkonsistenz hoch. Fuegen Sie ein Referenzvideo (3-10s, max. 200MB) zur Videobearbeitung hinzu.
Waehlen Sie Standard oder Pro Modus, Seitenverhaeltnis (16:9, 9:16, 1:1), Dauer (3-15s) und ob Audio generiert werden soll.
Das Modell verarbeitet alle Eingaben zusammen und gibt ein Video mit optionalem synchronisiertem Audio aus.
Laden Sie bis zu 7 Referenzbilder hoch (4 in Kombination mit Video), um das Erscheinungsbild und den visuellen Stil zu steuern.
Stellen Sie ein Referenzvideo bereit und beschreiben Sie die Aenderungen. Das Modell bewahrt die Bewegung und wendet Ihre Aenderungen an.
Verwenden Sie den Feature-Modus fuer Stiltransfer oder den Base-Modus fuer direkte Videobearbeitung mit Bewegungserhaltung.
Erstellen Sie bis zu 6 verbundene Aufnahmen mit konsistenten Charakteren ueber die gesamte Sequenz.
Generieren Sie synchronisiertes Audio einschliesslich Dialoge, Soundeffekte und Umgebungsgeraeusche.
Behalten Sie bei der Videobearbeitung optional die Original-Audiospur Ihres Referenzclips bei.
Sekundenbasierte Preisgestaltung je nach Modus.
$0,112 pro Sekunde. Ein 10-Sekunden-Video kostet $1,12.
$0,168 pro Sekunde mit hoeherer Ausgabequalitaet. Ein 10-Sekunden-Video kostet $1,68.
Omni ist die richtige Wahl, wenn Sie referenzbasierte Kontrolle oder Videobearbeitungsfunktionen benoetigen.
Laden Sie Marken-Referenzbilder hoch, um Videos zu generieren, die Ihrer visuellen Identitaet ueber Kampagnen hinweg entsprechen.
Behalten Sie denselben Charakter ueber mehrere Szenen bei, indem Sie Referenzbilder Ihres Motivs bereitstellen.
Verwandeln Sie vorhandenes Filmmaterial in verschiedene visuelle Stile und bewahren Sie dabei die urspruengliche Bewegung und das Timing.
Generieren Sie mehrere Versionen von Produktvideos mit verschiedenen Stilen oder Einstellungen aus derselben Referenz.
Videos mit multimodalen Referenzen und Stilkontrolle generieren und bearbeiten.
Der nächste Sprung in der KI-Videogenerierung. Kling 4.0 verschiebt die Grenzen von Bewegung, Auflösung und kreativem Storytelling. Bleiben Sie dran.
Generieren Sie Videos mit dem neuesten Kling 3.0 Modell. Native 4K-Ausgabe, Multi-Shot-Sequenzierung, integrierte Audiogenerierung und Bild-zu-Video-Unterstützung.
Bewegungen aus beliebigen Referenzvideos auf ein statisches Bild uebertragen - mit erhaltener Identitaet und fliessender Animation
Erstellen Sie schnelle und kostengünstige KI-Videos mit Kling O3. Text-zu-Video, Bild-zu-Video, Multi-Shot-Sequenzierung, natives Audio und 4K-Ausgabe – zu geringeren Kreditkosten als Kling 3.0.
Verwandeln Sie jedes Portraet in ein sprechendes Video mit audiosynchronem Lip-Sync bei 1080p 48fps
Das Modell der Wahl für filmreife KI-Videos mit nativem Audio. Kling 2.6 liefert fortschrittliche Bewegungskonsistenz, realistische Lippensynchronisation und reichhaltiges Sounddesign — alles aus einem einzigen Prompt.
Steuern Sie die Bewegung von Elementen in Ihrem Video - zeichnen Sie Pfade, uebertragen Sie Bewegungen aus Referenzclips, animieren Sie bis zu 6 Elemente
Erstellen und bearbeiten Sie hochwertige KI-Bilder mit Kling O3. Text-zu-Bild-Erzeugung und Bildbearbeitung mit Referenzeingaben – Auflösung 1K bis 4K, mehrere Seitenverhältnisse, 5 Credits pro Bild.
Generieren Sie mit Nano Banana 2 ultraschnelle fotorealistische KI-Bilder. Text-zu-Bild- und Bild-zu-Bild-Generierung in 1K-, 2K- oder 4K-Auflösung über ein breites Spektrum an Seitenverhältnissen.