توليد وتحرير مقاطع الفيديو من النص والصور ومراجع الفيديو في نموذج موحد واحد
Kling 3.0 Omni هو نموذج فيديو متعدد الوسائط موحد يقبل النص والصور والفيديو كمدخلات. يجمع بين النص إلى فيديو والصورة إلى فيديو والتوليد القائم على المرجع وتحرير الفيديو في خط أنابيب واحد مع إخراج صوتي أصلي.
أدخل أوصاف نصية وصور مرجعية (حتى 7) ومقاطع فيديو موجودة في نموذج واحد.
تحرير مقاطع الفيديو الموجودة من خلال توفير مقطع مرجعي ووصف التغييرات بلغة طبيعية.
الحفاظ على نفس مظهر الشخصية عبر لقطات ومشاهد متعددة باستخدام الصور المرجعية.
تطبيق الأنماط البصرية من الصور أو مقاطع الفيديو المرجعية على المحتوى المولد.
ابدأ بوصف نصي، أو قم بتحميل صور مرجعية لاتساق النمط، أو قدم فيديو للتحرير.
قم بتحميل ما يصل إلى 7 صور مرجعية لاتساق الشخصية أو النمط. أضف فيديو مرجعي (3-10 ثوانٍ، بحد أقصى 200 ميجابايت) لتحرير الفيديو.
اختر الوضع القياسي أو الاحترافي، ونسبة العرض إلى الارتفاع (16:9، 9:16، 1:1)، والمدة (3-15 ثانية)، وما إذا كنت تريد توليد الصوت.
يعالج النموذج جميع المدخلات معًا ويخرج فيديو مع صوت متزامن اختياري.
قم بتحميل ما يصل إلى 7 صور مرجعية (4 عند دمجها مع الفيديو) لتوجيه مظهر الشخصية والنمط البصري.
قدم فيديو مرجعي وصف التعديلات. يحافظ النموذج على الحركة أثناء تطبيق التغييرات.
استخدم وضع 'feature' لنقل النمط أو وضع 'base' للتحرير المباشر مع الحفاظ على الحركة.
إنشاء ما يصل إلى 6 لقطات متصلة مع شخصيات متسقة عبر التسلسل بأكمله.
توليد صوت متزامن بما في ذلك الحوار والمؤثرات الصوتية والأصوات المحيطة.
عند تحرير الفيديو، احتفظ اختياريًا بالمسار الصوتي الأصلي من المقطع المرجعي.
التسعير بالثانية بناءً على اختيار الوضع.
0.112 دولار لكل ثانية. فيديو مدته 10 ثوانٍ يكلف 1.12 دولار.
0.168 دولار لكل ثانية مع إخراج عالي الجودة. فيديو مدته 10 ثوانٍ يكلف 1.68 دولار.
Omni هو الخيار الصحيح عندما تحتاج إلى تحكم قائم على المرجع أو قدرات تحرير الفيديو.
قم بتحميل صور مرجعية للعلامة التجارية لتوليد مقاطع فيديو تتطابق مع هويتك البصرية عبر الحملات.
احتفظ بنفس الشخصية عبر مشاهد متعددة من خلال توفير صور مرجعية لموضوعك.
تحويل اللقطات الموجودة إلى أنماط بصرية مختلفة مع الحفاظ على الحركة والتوقيت الأصلي.
توليد إصدارات متعددة من مقاطع فيديو المنتج بأنماط أو إعدادات مختلفة من نفس المرجع.
Next-generation AI video model — Coming Soon
Native 4K, multi-shot sequencing & integrated audio
Transfer motion from reference video to image
Natural language video editing with motion preservation
Talking head generation with audio lip-sync at 48fps
Cinematic motion with native audio & lip-sync
Motion path control with up to 6 independent elements
Ultra-fast photorealistic image generation