
نموذج الفيديو بالذكاء الاصطناعي Kling 3.0
Kling 3.0 هو أقوى نموذج فيديو بالذكاء الاصطناعي من Kuaishou حتى الآن. يقدم هذا الإصدار الجديد سردًا متعدد اللقطات، مع تحسين الاتساق الزمني، وتعزيز الحفاظ على النص، ودعم صوت أصلي متعدد اللغات، بالإضافة إلى تحرير متقدم للوحة القصة لإنتاج مقاطع نهائية بمستوى استوديو تصل مدتها إلى 15 ثانية.
جربه مجانًا!أبرز مميزات Kling 3.0
- تسلسلات سينمائية متعددة اللقطات: ينتج مشاهد معقدة متعددة اللقطات لسرد قصص بصري ديناميكي
- ثبات متسق للشخصية: يحافظ على هوية الشخصية عبر حركات الكاميرا وتغييرات المشهد
- تحكم دقيق في السرد: يتيح حوارات متعددة الشخصيات مصممة خصيصًا لكل شخصية عبر المشاهد
- صوت أصلي مطور: يدعم حديث الشخصيات المتزامن مع الشفاه بلغات ولهجات ولهجات متعددة
- حفظ محسّن للنصوص: ينشئ/يحافظ على نصوص واضحة مثل الشعارات والعلامات في المشاهد للاستخدام التجاري الإلكتروني
- توليد فيديو ممتد: يوفر ما يصل إلى 15 ثانية لكل تسلسل مع مدة مرنة لروايات أطول
- تحكم مرن في لوحة العمل: خصّص كل لقطة في المشهد لتحديد المدة، المنظور، حركة الكاميرا، إلخ.
تسلسلات سينمائية متعددة اللقطات
تم بناء Kling 3.0 لتسلسل اللقطات المتعددة، مما يمكّن المستخدمين من إنتاج مقاطع فيديو ديناميكية للغاية تطبق تقنيات سينمائية متقدمة. سواء كان ذلك تصويرًا متقابلًا، أو قطعًا متقاطعًا، أو فوق الكتف، وما إلى ذلك، يمكن لنموذج الذكاء الاصطناعي التكيف مع زوايا الكاميرا ولقطات مختلفة تناسب الأشكال المعقدة لسرد القصص.
| اللقطة 1 | اللقطة 2 | اللقطة 3 |
ثبات متسق للشخصية
مع توفر الإشارة إلى صور وفيديوهات متعددة، يمكن لمستخدمي Kling 3.0 تحديد عناصر وسمات معينة للشخصيات والأشياء الرئيسية بدقة أكبر. يعزز هذا استقرار الشخصية والمشهد لتقديم سرد بصري أكثر طبيعية واتساقًا، مما يقلل من خطر عدم تلبية المقطع النهائي للتوقعات.
| صورة مرجعية | الموجه | فيديو الإخراج |
![]() |
تركض عبر سوق سايبربانك مضاء بالنيون. أولاً، تُرى وهي تركض باتجاه الكاميرا تحت أضواء النيون الزرقاء، وتعبير وجهها شرس. ثم، تتحرك الكاميرا لتتبعها وهي تقفز فوق كشك إلى زقاق مظلم ومُبخّر مضاء بفوانيس حمراء. طوال الحركة الديناميكية وتغير الإضاءة من الأزرق إلى الأحمر، تظل ملامح وجهها، وتسريحة شعرها، وزيها التكتيكي متسقة ويمكن التعرف عليها تمامًا. |
تحكم دقيق في السرد
يتيح Kling 3.0 للمستخدمين إنتاج مشاهد سينمائية دقيقة مع حوارات متعددة الشخصيات، مما يتيح تحكمًا محددًا في الأداء، وترتيب الكلام، والتوقيت. وبسبب هذا، يمكن لأي شخص ببساطة اختيار الشخصية التي تتحدث وماذا تقول، وكيف، ومتى، مما يفتح مسارات إبداعية جديدة لكتابة سيناريو أكثر تعقيدًا وجاذبية.
| الموجه | فيديو الإخراج |
| اجتماع متوتر في مجلس الإدارة مع شخصيتين مختلفتين تجلسان مقابل بعضهما البعض. الشخصية أ (رجل أكبر سنًا يرتدي بدلة رمادية): يميل إلى الأمام ويقول بصرامة، 'الصفقة منتهية، سيد فانس.' الشخصية ب (رجل أصغر سنًا يرتدي قميصًا أزرق): يبتسم، يميل إلى الخلف في كرسيه، ويرد بهدوء، 'أعتقد أنه يجب عليك إعادة النظر في البيانات.' تركز الكاميرا على الشخصية أ التي تتحدث أولاً، ثم تركز بشكل حاد على الشخصية ب لردّه. تزامن شفاه دقيق وأدوار تحدث مميزة مطلوبة. |
صوت أصلي مطور
Kling 3.0 قادر على إنشاء صوت أصلي بلغات متعددة تشمل الإنجليزية والصينية والإسبانية واليابانية والكورية. علاوة على ذلك، يدعم نموذج الذكاء الاصطناعي لهجات ولهجات إقليمية، مما يتيح للمستخدمين إنتاج مشاهد حوارية متزامنة مع الشفاه تبدو أصيلة للجماهير العالمية.
| الموجه | فيديو الإخراج |
| مقابلة وثائقية بلقطة قريبة مع طاهي سوشي مسن في طوكيو. ينظر مباشرة إلى الكاميرا بابتسامة دافئة. يتحدث باللغة اليابانية بطلاقة: 'سر السوشي ليس فقط في السمك، بل في القلب الذي تضعه في الأرز.' (مطلوب توليد صوت: صوت ياباني أصلي لرجل، نبرة هادئة وحكيمة). يجب أن تتطابق حركات الشفاه تمامًا مع المقاطع اللفظية اليابانية، مع التقاط الوقفات الخفية والتنفس. |
حفظ محسّن للنصوص
يضمن Kling 3.0 بقاء أي محتوى نصي تم إنشاؤه أو عناصر بصرية مثل اللافتات أو الشعارات من الصور المرجعية محفوظة عبر المشاهد البصرية بدقة ممتازة. يساعد هذا بشكل خاص الشركات أو المستخدمين في التجارة الإلكترونية الذين يتطلعون إلى إنتاج لقطات ترويجية تتضمن عناصر تحمل علامة تجارية.
| الموجه | فيديو الإخراج |
| لقطة تجارية لمنتج لمشروب طاقة وهمي يسمى "BOLT". علبة ألومنيوم أنيقة مكتوب عليها كلمة "BOLT" بأحرف صفراء كبيرة وسميكة تدور ببطء في الهواء مع خلفية مياه متناثرة. قطرات الماء تضرب العلبة في حركة بطيئة. بينما تدور العلبة 360 درجة، يظل نص "BOLT" مقروءًا تمامًا وحادًا ولا يتشوه أو يلتوي، مع الحفاظ على نمط الخط الدقيق من الصورة المرجعية. |
توليد فيديو ممتد
يمكن لنموذج Kling 3.0 إنشاء مقاطع فيديو أطول مع إمكانية ضبط مدة مرنة بين 3 ثوانٍ و 15 ثانية لكل توليد. مع هذا التوسع، يصبح من الممكن للمبدعين وصناع الأفلام استكشاف رواية قصص أكثر تعقيدًا وتسلسلات دقيقة دفعة واحدة بدلاً من الاكتفاء بمشاهد مجزأة.
| الموجه | فيديو الإخراج |
| لقطة تتبع مستمرة لمدة 15 ثانية لكلب جولدن ريتريفر يركض عبر منظر طبيعي متغير. يبدأ الكلب بالركض في حديقة عشبية، وينتقل بسلاسة إلى الركض على طول شاطئ رملي عند غروب الشمس، وأخيرًا يركض عبر مسار غابة ثلجي. الانتقال بين البيئات سلس وحالم. يظل تشريح الكلب ومشية الركض واقعيين ومستقرين طوال مدة الـ 15 ثانية دون أن يتشوه إلى حيوانات أخرى. |
تحكم مرن في لوحة العمل
مع Kling 3.0، يمكن للمبدعين عزل ما يصل إلى 6 لقطات مميزة في تسلسل بصري وتخصيص لوحة العمل بأي طريقة يرونها مناسبة. هذا يعني تخصيص جوانب محددة لكل لقطة مثل المدة، حجم اللقطة، حركات الكاميرا، المنظور، السرد، وما إلى ذلك، مما يضمن نهجًا دقيقًا يقدم سردًا أكثر تطورًا.
| فيديو الإخراج |
Kling 3.0 مقابل Sora 2 مقابل Veo 3.1: جدول مقارنة الميزات
اكتشف كيف تقارن نماذج الفيديو بالذكاء الاصطناعي Kling 3.0 و Sora 2 و Veo 3.1 ببعضها البعض هنا:
| الفئة | Kling 3.0 | Sora 2 | Veo 3.1 |
| تنسيقات الإدخال | T2V، I2V، و V2V | T2V و I2V | T2V، I2V، و V2V |
| التركيز الأساسي | سرد ديناميكي متعدد اللقطات | الواقعية البصرية وديناميكا الحركة | الالتزام القوي بالم وجهات النظر والإلهام السينمائي |
| الصوت الأصلي | نعم (مع دعم لغات متعددة) | نعم | نعم |
| أقصى طول للفيديو (لكل توليد) | 15 ثانية | 25 ثانية | 8 ثوانٍ |
| دقة الإخراج | متوفر حتى 4K | متوفر حتى 1080p | متوفر حتى 4K |
| سرعة التوليد | 30 - 60 ثانية لكل فيديو | 30 ثانية - دقيقتين لكل فيديو | 2 - 4 دقائق لكل فيديو |
| مثالي لـ | مشاهد حوارية معقدة متعددة الشخصيات | لقطات واقعية مثل مقاطع الرقص، الرياضة، الإعلانات الترويجية، إلخ. | مقاطع سينمائية، إعلانات تشويقية، ورسوم متحركة |

كيفية استخدام Kling 3.0 على Pollo AI
اختر Kling 3.0
انتقل إلى صفحة Pollo AI Image to Video واختر نموذج Kling 3.0 .
تفاصيل الإدخال
قم بتحميل صورة مرجعية و/أو اكتب نصًا يصف صورتك.
توليد الفيديو
انقر على "إنشاء" وانتظر بصبر ريثما يتم تجهيز الفيديو الخاص بك للتنزيل.
مقاطع فيديو يوتيوب حول Kling 3.0
منشورات ريديت حول Kling 3.0
منشورات X حول Kling 3.0
🧵1/3 I partnered with Kling to make a promo for their new 3.0 model. I came up with the concept, created it and delivered it all on my own in 3 days of early access, I wanted to make something that showed how Kling could be used to tell a diverse range of stories in a diverse… pic.twitter.com/N6Vn9QOOVJ
— Uncanny Harry AI (@Uncanny_Harry) February 4, 2026
Kling 3.0 just dropped and it's insane 🎥 👀
— Macai (@piotrmacai) February 5, 2026
✅ Up to 15s cinematic videos, native audio with perfect lip-sync,
✅ multi-shot storyboarding, ✅ top-level character consistency,
✅ way more lifelike motion & emotions.
Everyone's a director now 👀 pic.twitter.com/s1mlAyveRT
The legendary Hakari Dance from JJK just got a massive, hyper-realistic upgrade.
— Nabab Uddin (@NababUddin2) February 9, 2026
I used Kling 3.0 to bring this infinite cursed energy to life, and the movement fluidity is actually insane.@Kling_ai pic.twitter.com/LrtnWTnAsS
Character consistency from a single frame combined with Kling 3.0's multishot system is just insane.
— Pierrick Chevallier | IA (@CharaspowerAI) February 6, 2026
Visual identity stays intact, cinematic shot flow, smooth storytelling —
this clearly sets a new standard 🤯 pic.twitter.com/O8NR3AJsOE
Kling 3.0 is pure fun.
— Alex Patrascu (@maxescu) February 5, 2026
And it's not about the perfect audio, the 15s clips, the 1080p, the multi-shots, the amazing fidelity, etc.
It's about how it perfectly understands a scene, even with simple prompts: pic.twitter.com/5YVBuGrBNY
Kling 3.0 just dropped 🚨
— Richie 🇺🇸 🇮🇳 (@RichieReach_) February 6, 2026
and it's already available inside Arcads.
People are losing their mind over:
> 3s-15s multi-shot sequences
> Native audio with multiple characters
> Strong voices with, accents, and languages
> Built-in sound design and music
> Consistency across cuts… pic.twitter.com/j6z03HtHbm
forget Sora, Kling 3.0 is the new standard
— MAX (@maxxmalist) February 7, 2026
been testing it for 48 hours straight and the physics engine is unreal
this video took me less than 10 minutes to create, and all i needed was 2 images + a multi prompt, that's it.. everything else the model figured out on its own… pic.twitter.com/63DeQM33C0
testing Kling 3.0 for real product generation! 🍷
— Sofiia Shvets 🇺🇦 (@Sofi_Shvets) February 5, 2026
so far, I'm really happy with the product accuracy. multi-shot direction took a few trials to nail, and the 15-second max means it's currently best for short product videos or quick UGC.
native audio still feels a bit… pic.twitter.com/3NghtNJjOa
Kling 3.0 just dropped!
— Nadia Zueva (@nestymee) February 4, 2026
this isn't an update, it's a reset.
- up to 15 sec per generation (was 10)
- multi-shot: up to 6 cuts in one video, auto camera work
- native audio: voices, music, ambient
- character consistency across generations (face + voice)
public release soon! pic.twitter.com/B8yI6DwfqF
Kling 3.0 | Stress Test | Vol. I
— Reigning Words (@lerenyaew) February 9, 2026
First Kling 3.0 takeaway: the physics are noticeably better. Cars actually rattle, shift, and move like they have weight. Weapons have cleaner recoil too.
Second takeaway: the built-in sound is way stronger than expected. I didn't add any extra… pic.twitter.com/20IQ9TBX9K
@Kling_ai 3.0 is here !! And man it smashes so hard !
— Stéphane (@STranquillin) February 4, 2026
More languages
Customizable multishot,
15 generations,
Perfect consistency, natural motion and expressions, etc.
It's a game changer and I usually don't use this word !
Here's a very early test with multishot 👇 pic.twitter.com/K1Pr6kWk2u
Kling 3.0 dropped and it's absolutely game changing.
— GLIF (@heyglif) February 6, 2026
This video was generated from a single image.
We put together a prompting guide to help you get the most out of using this incredible model.
Guide linked below 👇 pic.twitter.com/WVWoKjnMK5
الأسئلة الشائعة
ما هو Kling 3.0؟
يُعدّ Kling 3.0 ، الذي طورته شركة Kuaishou، أحدث نموذج لإنتاج الفيديو بتقنية الذكاء الاصطناعي، وهو مصمم خصيصًا للإنتاج السينمائي المتقدم. يتميز هذا النموذج بتحسينات عديدة في تناسق الشخصيات، والواقعية البصرية، والصوت الأصلي، والمدة، بالإضافة إلى إمكانية سرد القصص من خلال لقطات متعددة، مما يمنح المستخدمين حرية إبداعية كاملة في جميع المشاهد بدقة متناهية.
كيف يكون Kling 3.0 أفضل من Kling 2.6؟
بالمقارنة مع Kling 2.6، يمنحك Kling 3.0 تحكمًا حقيقيًا بمستوى المخرج بين يديك. في كل عملية إنشاء مدتها 15 ثانية، يمكنك إنتاج سرد متعدد اللقطات وتخصيص كل لقطة بدقة لصياغة قصة بصرية متكاملة دفعة واحدة مع تضمين الصوت الأصلي. وبهذا يمكنك الاستغناء تقريبًا بشكل كامل عن الحاجة إلى عمليات ما بعد الإنتاج التقليدية.
هل يمكنني إنشاء مقاطع فيديو باستخدام Kling 3.0 مجاناً؟
نعم. يمكنك التوجه إلى Pollo AI وإنشاء حساب للوصول إلى الخطة التجريبية المجانية. ستمنحك هذه الخطة عددًا محدودًا من الرصيد لإنشاء فيديوهات باستخدام Kling 3.0 دون أي تكلفة. وعند نفاد الرصيد، يمكنك الاشتراك في خطة مدفوعة للحصول على رصيد إضافي.
ما أنواع المدخلات المرجعية التي يمكنني استخدامها في Kling 3.0؟
يستخدم Kling 3.0 إطارًا موحدًا متعدد الوسائط يدعم النصوص والصور والصوت والفيديو. وبالاقتران مع التحكم المتقدم في لوحة القصة، يمنحك دقة ومرونة أكبر لإنتاج تسلسلات سينمائية كاملة تتوافق بشكل وثيق مع رؤيتك الإبداعية المقصودة.
ما هي دقة الفيديو الأصلية التي يدعمها Kling 3.0 ؟
يوفر Kling 3.0 إنشاء بدقة 2K و4K أصلية، متفوقًا بشكل كبير على تقنيات تكبير الدقة في المعالجة اللاحقة. يضمن ذلك أن اللقطات التي تنشئها تعرض تفاصيل أكثر حدة على مستوى البكسل وملمسًا أكثر واقعية مثل الشعر والبشرة والأقمشة مقارنةً بنماذج الفيديو بالذكاء الاصطناعي السابقة.
في أي الجوانب البصرية يتفوق Kling 3.0 أكثر؟
يتميز أحدث نموذج Kling 3.0 بقدرة عالية على إظهار واقعية الشخصيات، مع إبراز تعابير الوجه الطبيعية والحركات الدقيقة بتفاصيل دقيقة للغاية. كما يوفر مزامنة شبه مثالية لحركة الشفاه، مما يتيح لك إنشاء حوارات سلسة بلغات ولهجات أصلية لأداء يبدو مقنعًا للغاية.
