自然言語で動画を編集 -- 変更内容を記述するだけでモデルが処理します








Kling O1は、編集に特化した統合マルチモーダル動画モデルです。リファレンス動画を提供し、変更内容をテキストで記述するだけで、モデルが元のクリップのモーション、空間構造、タイミングを分析し、他の要素を維持しながら編集を適用します。
テキストで編集内容を記述するだけ。マスキング、キーフレーム設定、手動調整は不要です。
元の動画のカメラパス、体の動き、タイミングが編集中も維持されます。
リファレンス画像を使用して、キャラクター置換やスタイル転送などの特定のビジュアル変更をガイドします。
<<<image_1>>>や<<<video_1>>>構文を使って、プロンプト内で画像や動画を直接参照できます。
編集したい動画を提供します。MP4、MOV、WebM、M4V、またはGIF。3-10秒、最大200MB。
変更したい内容を記述します。プロンプト内で<<<video_1>>>で動画を、<<<image_1>>>でリファレンス画像を参照できます。
キャラクターの外観や環境スタイルなどのビジュアル変更をガイドするために、最大7枚のリファレンス画像をアップロードできます。
StandardまたはProモードを選択します。モデルが元のモーションとタイミングを保持しながら編集を適用します。
自然言語で変更内容を記述して動画を編集。タイムライン、マスク、手動フレーム編集は不要です。
モデルが変更を適用する前に、動画の3D構造とタイミングを理解します。
プロンプト内で<<<image_1>>>や<<<video_1>>>を使用して、アップロードしたメディアを正確に参照できます。
複数のリファレンス画像を提供して、キャラクターの外観、環境、スタイルの変更をガイドします。
スタイルガイダンスには「feature」モード、フルモーション保持付きの直接編集には「base」モードを使用します。
入力はMP4、MOV、WebM、M4V、GIFに対応。解像度範囲: 720pxから2160px。

秒単位の料金設定。一般的な編集は$0.50-$1.68です。
1秒あたり$0.168。5秒の編集で$0.84、10秒の編集で$1.68です。
1秒あたり$0.112。5秒の編集で$0.56、10秒の編集で$1.12です。

O1は手動のポストプロダクションツールを使わずに既存の動画映像を編集するために設計されています。
既存の映像で衣装の変更、背景の差し替え、照明の調整、天候条件の変更が可能です。
元のカメラワークとモーションを保持しながら、動画に特定のビジュアルスタイルを適用します。
リファレンス画像を使用して動画内のキャラクターを置換し、動きやインタラクションを保持します。
アクションを維持しながら、動画の設定を変換します。季節、時間帯、場所の変更が可能です。
AI動画生成の次なる飛躍。Kling 4.0はモーション、解像度、クリエイティブなストーリーテリングの限界を押し広げます。ご期待ください。
のKling 3.0で動画を生成。ネイティブ4K出力、マルチショットシーケンス、統合オーディオ生成、画像から動画に対応。
テキスト、画像、動画リファレンスから動画を生成・編集できる統合モデル
リファレンス動画のモーションを静止画に転送し、アイデンティティを保持したスムーズなアニメーションを生成
Kling O3 を使用して、高速かつ手頃な価格の AI ビデオを生成します。テキストからビデオへ、画像からビデオへ、マルチショット シーケンス、ネイティブ オーディオ、4K 出力を、Kling 3.0 よりも低いクレジット コストで実現します。
あらゆるポートレートを音声同期リップシンク付きのトーキング動画に変換。1080p 48fps対応
高品質AI動画のための決定版モデル。Kling 2.6は業界最高水準のモーション一貫性、リアルなリップシンク、豊かなサウンドデザインを、たった一つのプロンプトから実現します。
動画内の要素の動きを制御 -- パスの描画、リファレンスクリップからのモーション転送、最大6要素のアニメーション
Kling O3 を使用して高品質の AI 画像を生成および編集します。リファレンス入力を使用したテキストから画像への生成と画像編集 — 1K から 4K までの解像度、複数のアスペクト比、画像ごとに 5 クレジット。
Nano Banana 2 を使用して、超高速でフォトリアリスティックな AI 画像を生成します。幅広いアスペクト比にわたる 1K、2K、または 4K 解像度でのテキストからイメージへの生成およびイメージからイメージへの生成。