自然言語で動画を編集 -- 変更内容を記述するだけでモデルが処理します
Kling O1は、編集に特化した統合マルチモーダル動画モデルです。リファレンス動画を提供し、変更内容をテキストで記述するだけで、モデルが元のクリップのモーション、空間構造、タイミングを分析し、他の要素を維持しながら編集を適用します。
テキストで編集内容を記述するだけ。マスキング、キーフレーム設定、手動調整は不要です。
元の動画のカメラパス、体の動き、タイミングが編集中も維持されます。
リファレンス画像を使用して、キャラクター置換やスタイル転送などの特定のビジュアル変更をガイドします。
<<<image_1>>>や<<<video_1>>>構文を使って、プロンプト内で画像や動画を直接参照できます。
編集したい動画を提供します。MP4、MOV、WebM、M4V、またはGIF。3-10秒、最大200MB。
変更したい内容を記述します。プロンプト内で<<<video_1>>>で動画を、<<<image_1>>>でリファレンス画像を参照できます。
キャラクターの外観や環境スタイルなどのビジュアル変更をガイドするために、最大7枚のリファレンス画像をアップロードできます。
StandardまたはProモードを選択します。モデルが元のモーションとタイミングを保持しながら編集を適用します。
自然言語で変更内容を記述して動画を編集。タイムライン、マスク、手動フレーム編集は不要です。
モデルが変更を適用する前に、動画の3D構造とタイミングを理解します。
プロンプト内で<<<image_1>>>や<<<video_1>>>を使用して、アップロードしたメディアを正確に参照できます。
複数のリファレンス画像を提供して、キャラクターの外観、環境、スタイルの変更をガイドします。
スタイルガイダンスには「feature」モード、フルモーション保持付きの直接編集には「base」モードを使用します。
入力はMP4、MOV、WebM、M4V、GIFに対応。解像度範囲: 720pxから2160px。
秒単位の料金設定。一般的な編集は$0.50-$1.68です。
1秒あたり$0.168。5秒の編集で$0.84、10秒の編集で$1.68です。
1秒あたり$0.112。5秒の編集で$0.56、10秒の編集で$1.12です。
O1は手動のポストプロダクションツールを使わずに既存の動画映像を編集するために設計されています。
既存の映像で衣装の変更、背景の差し替え、照明の調整、天候条件の変更が可能です。
元のカメラワークとモーションを保持しながら、動画に特定のビジュアルスタイルを適用します。
リファレンス画像を使用して動画内のキャラクターを置換し、動きやインタラクションを保持します。
アクションを維持しながら、動画の設定を変換します。季節、時間帯、場所の変更が可能です。
Next-generation AI video model — Coming Soon
Native 4K, multi-shot sequencing & integrated audio
Multimodal generation, video editing & style consistency
Transfer motion from reference video to image
Talking head generation with audio lip-sync at 48fps
Cinematic motion with native audio & lip-sync
Motion path control with up to 6 independent elements
Ultra-fast photorealistic image generation