خلال الأيام القليلة الماضية، سيطر نموذج الفيديو بالذكاء الاصطناعي التابع لشركة بايت دانس، سيدانس 2.0، بشكل كامل على الإنترنت.
تنتشر مقاطع الفيديو التي تم إنشاؤها بواسطة برنامج Seedance 2.0 في كل مكان الآن.
يستخدمه البعض لإنشاء مشاهد مطاردة بمستوى الأفلام. بينما يعيد آخرون ابتكار حركات الكاميرا السينمائية التي نراها عادةً في الإعلانات التجارية الضخمة. بل إن البعض يحوله إلى مسلسلات تاريخية، أو قصص عن السفر عبر الزمن، أو أفلام فنون قتالية مليئة بالإثارة - لقطات فائقة الوضوح والدقة لدرجة يصعب معها التمييز بين ما إذا كانت من صنع الذكاء الاصطناعي أو تم تصويرها بممثلين حقيقيين.
وبصراحة، هذا ليس مبالغة.
مع هذا التحديث، أزال برنامج Seedance 2.0 بشكل أساسي الحاجز أمام إنشاء الفيديو بالذكاء الاصطناعي إلى الأرض.
كفى كلامًا، لنبدأ بمقطع سريع ↓
إذن... كيف يبدو الأمر؟
لماذا انتشرت هذه التقنية بهذه السرعة؟ لأنها حلت أخيراً مشكلة أرّقت المبدعين لسنوات: كان الفيديو المدعوم بالذكاء الاصطناعي يتمحور حول التوليد، أما الآن، فهو يتمحور حول التحكم.
امزج الصور والفيديو والصوت والنصوص بحرية – يمكن لأي شخص أن يقوم بالإخراج.

هذه المرة، الأمور مختلفة.
لم يعد برنامج Seedance 2.0 مجرد أداة لتحويل النصوص إلى فيديوهات ، بل تطور ليصبح منصة حقيقية متعددة الوسائط لإنشاء الفيديوهات قادرة على فهم الغاية الإبداعية.
يمكنك تزويده بالصور ومقاطع الفيديو والصوت والنصوص في آن واحد. تحدد له وظيفة كل عنصر، ثم يقوم بدمجها معًا لإنتاج فيديو كامل.
يبدو الأمر مجرداً بعض الشيء؟ لا بأس.
سأشرح كل ميزة وسير عمل خطوة بخطوة، وسأوضح لك بالضبط كيف يستخدمها الناس.
أولاً وقبل كل شيء: ما الذي يمكن أن يفعله برنامج Seedance 2.0 فعلاً؟
في جوهرها، هناك ترقية رئيسية واحدة وراء Seedance 2.0: تعدد الوسائط.
في نماذج الفيديو السابقة التي تعمل بالذكاء الاصطناعي ، كانت خيارات الإدخال الخاصة بك تقتصر عادةً على أمرين فقط: إما كتابة نص أو تحميل صورة واحدة من الإطار الأول.
إذا أردت التحكم في حركة الكاميرا، أو تعابير الوجه، أو إيقاع الموسيقى الخلفية، كان عليك إدخال كل شيء في نص. وكان نجاح هذه الطريقة يعتمد بشكل شبه كامل على مدى براعتك في كتابة التعليمات.
يُغير برنامج Seedance 2.0 هذا الأمر من خلال توسيع المدخلات لتشمل أربع طرائق مختلفة.
صور
يمكنك تحميل ما يصل إلى 9 صور. يمكن لهذه الصور تحديد مظهر الشخصية، وأسلوب المشهد، وتفاصيل الملابس، والصور المرئية للمنتج، أو حتى إطارات لوحة القصة.
فيديو
يمكنك تحميل ما يصل إلى 3 مقاطع فيديو، بمدة إجمالية لا تتجاوز 15 ثانية. يستطيع النموذج الرجوع إلى حركة الكاميرا، وإيقاع الحركة، وأنماط الانتقال من هذه المقاطع. عمليًا، يُشبه هذا تزويد النموذج بعينة مرئية ليتعلم منها.
صوتي
يدعم التطبيق تحميل ملفات MP3، بحد أقصى 3 ملفات لا تتجاوز مدتها الإجمالية 15 ثانية. يمكنك تحديد موسيقى خلفية، أو أنماط مؤثرات صوتية، أو حتى استخدام نبرة التعليق الصوتي من فيديو آخر.
نص
ما عليك سوى وصف العناصر المرئية والحركات والوتيرة التي تريدها عن طريق إدخال لغة طبيعية قياسية.
يمكن دمج جميع أنواع المدخلات الأربعة بحرية. الحد الأقصى لعدد الملفات المرفوعة عبر جميع الوسائط هو 12 ملفًا.
يمكن أن يصل طول الفيديو المُنشأ إلى 15 ثانية. يمكنك اختيار أي مدة بين 4 و15 ثانية، ويأتي الناتج مزودًا بمؤثرات صوتية وموسيقى خلفية مدمجة.
ببساطة، يمكنك الآن توجيه الذكاء الاصطناعي مثل مخرج أفلام حقيقي:
- تُحدد الصور الأسلوب البصري.
- الفيديو يُعرّف الحركة.
- الصوت يحدد الإيقاع.
- النص يحدد القصة.
مواصفات الإدخال والإخراج لبرنامج Seedance 2.0
| المعلمة | وصف |
| إدخال الصور | ما يصل إلى 9 صور |
| إدخال الفيديو | ما يصل إلى 3 مقاطع، بمدة إجمالية لا تتجاوز 15 ثانية |
| مدخل الصوت | يدعم تشغيل ملفات MP3، حتى 3 ملفات، بمدة إجمالية لا تتجاوز 15 ثانية |
| إدخال نصي | وصف اللغة الطبيعية (يدعم اللغتين الإنجليزية والصينية) |
| مدة الإخراج | من 4 إلى 15 ثانية |
| مخرج الصوت | مؤثرات صوتية مدمجة وموسيقى خلفية |
| الحد الأقصى لعدد الملفات | الحد الأقصى 12 ملفًا في جميع المواد التي تم تحميلها |
نصيحة سريعة قبل البدء : لا تؤدي المواد المرجعية الإضافية دائمًا إلى نتائج أفضل.
أعط الأولوية للأصول التي لها أكبر تأثير على العناصر المرئية أو وتيرة اللعب، وخصص مساحات التحميل بحكمة.

كيفية استخدامه: دليل إرشادي خطوة بخطوة
الخطوة الأولى: اختيار نقطة الدخول المناسبة
افتح تطبيق Jimeng وابحث عن Seedance 2.0.
يمكنك الوصول إلى Seedance 2.0 عبر Jimeng. وسيكون متاحًا قريبًا أيضًا على صفحة Pollo AI Image to Video .
سترى نقطتي دخول مختلفتين.
- الإطار الأول والأخير : استخدم هذا الخيار عندما تقوم بتحميل صورة واحدة فقط للإطار الأول مع مطالبة نصية.
- مرجع الكل في واحد : استخدم هذا الخيار عندما تحتاج إلى مدخلات متعددة الوسائط، مثل مزيج من الصور والفيديو والصوت والنص.
كيف تقرر أيها تستخدم؟ اتبع قاعدة بسيطة: إذا كانت موادك تتكون من صورة واحدة ونص فقط، فاختر الإطار الأول والأخير؛ أما إذا كان لديك أكثر من صورة، أو إذا كان هناك فيديو أو صوت، فاختر المرجع الشامل.
في معظم الحالات، يُعدّ برنامج All-in-One Reference الخيار الأفضل. فهو يدعم جميع أنواع مدخلات المراجع، كما أنه يُتيح لبرنامج Seedance 2.0 إظهار أحدث إمكانياته بالكامل.

الخطوة الثانية: تحميل ملفاتك
انقر على زر التحميل واختر الملفات من جهازك. يمكنك سحب الصور والفيديوهات والملفات الصوتية مباشرةً. بعد اكتمال التحميل، ستظهر جميع الملفات في منطقة الإدخال. يمكنك تمرير مؤشر الماوس فوق كل ملف لمعاينة محتواه.
تذكير سريع قبل التحميل: فكّر جيداً في الملفات الأكثر أهمية. يمكنك تحميل ما يصل إلى 12 ملفاً إجمالاً، لذا أعطِ الأولوية للملفات التي لها أكبر تأثير على الأسلوب البصري وسرعة العرض.

الخطوة 3: تعيين دور لكل أصل باستخدام الرمز "@" (الخطوة الأهم)
هذا هو التفاعل الأساسي في Seedance 2.0، وهو أيضًا الجزء الذي يميل العديد من المبتدئين إلى تجاهله.
بعد تحميل ملفاتك، عليك تحديد وظيفة كل ملف منها للنموذج باستخدام اسم الملف (@asset name) داخل نافذة الأوامر. النموذج لا يعتمد على التخمين. إذا لم توضح ذلك بوضوح، فقد يستخدم الملفات بشكل خاطئ.
على سبيل المثال:
- @Image 1 كإطار أول
- @الفيديو 1 كمرجع للكاميرا
- @Audio 1 للموسيقى الخلفية
كيفية تفعيل رمز "@"
الطريقة الأولى
اكتب رمز "@" مباشرةً في مربع الإدخال. ستظهر قائمة بجميع الملفات المرفوعة. انقر على الملف الذي تريد الإشارة إليه، وسيتم إدراجه في مربع الإدخال.

الطريقة الثانية
انقر على زر "@" في شريط أدوات المعلمات بجوار مربع الإدخال. سيؤدي هذا أيضًا إلى إظهار قائمة الأصول.

أمثلة على الاستخدام الصحيح لعلامة "@"
- حدد الإطار الأول والمرجع: @Image 1 كإطار أول، وأشر إلى لغة الكاميرا الخاصة بـ @Video 1، واستخدم @Audio 1 للموسيقى الخلفية.
- حدد أدوار الشخصيات: الشخصية الأنثوية في الصورة 1 هي الشخصية الرئيسية، والشخصية الذكرية في الصورة 2 هي شخصية ثانوية.
- حدد مرجع حركة الكاميرا: قم بالرجوع بالكامل إلى جميع حركات الكاميرا والانتقالات من الفيديو رقم 1.
- حدد مراجع المشهد: استخدم @Image 3 كمرجع للمشهد الأيسر، و@Image 4 كمرجع للمشهد الأيمن
- حدد مرجع الحركة: يجب أن تشير الشخصية في @Image 1 إلى حركات الرقص من @Video 1
- حدد مرجع الصوت: يجب أن يشير صوت التعليق الصوتي إلى نبرة الصوت من الفيديو رقم 1.
مأزق شائع يجب الحذر منه
عند العمل مع العديد من الملفات، تأكد دائمًا من أن كل إشارة "@" تُطابق الملف الصحيح. فإذا أشرت إلى صورة على أنها فيديو، أو قمتَ عن طريق الخطأ بتعيين صورة الشخصية "أ" للشخصية "ب"، فقد يصبح الناتج فوضويًا بسرعة.
يمكنك تحريك مؤشر الماوس فوق أي أصل مُشار إليه في النافذة المنبثقة لمعاينته والتأكد من أن كل شيء مرتبط بشكل صحيح.

الخطوة الرابعة: كتابة سؤال واضح وفعال
بمجرد تعيين الأدوار لجميع الأصول باستخدام "@"، فإن الباقي يتعلق بوصف العناصر المرئية والإجراءات التي تريدها بلغة طبيعية.
إليكم أربع نصائح عملية لكتابة مواضيع أفضل.

نصيحة ١: اكتب وفقًا لهيكل زمني
إذا كان الفيديو الخاص بك يحتوي على مشاهد متعددة أو تحولات سردية، فمن الأفضل وصفها في أجزاء بناءً على الوقت.
على سبيل المثال:
0-3 ثوانٍ
يرفع البطل كرة السلة في يده، وينظر إلى الكاميرا، ويقول: "أردت فقط أن أشرب. هل أنا على وشك السفر عبر الزمن حقًا؟"
4-8 ثوانٍ
تهتز الكاميرا فجأة بعنف. ينتقل المشهد إلى ليلة ممطرة في منزل قديم. تنظر بطلة ترتدي زيًا تقليديًا ببرود نحو الكاميرا.
9-13 ثانية
تنتقل الكاميرا إلى شخصية ترتدي ملابس من عهد أسرة مينغ...
تساعد الكتابة بهذه الطريقة النموذج على فهم وتيرة ومحتوى كل جزء بدقة أكبر.
النصيحة الثانية: كن واضحاً بشأن الفرق بين "المرجع" و"التعديل".
هذان المفهومان ليسا متطابقين.
"الإشارة إلى حركة الكاميرا في الفيديو رقم 1" تعني استخدام أسلوب حركة الكاميرا الخاص به لإنشاء محتوى جديد.
"استبدال الشخصية الأنثوية في الفيديو رقم 1 بمؤدية أوبرا تقليدية" يعني تعديل الفيديو الأصلي نفسه.
حدد بوضوح أي واحد تريده، حتى يتمكن النموذج من الاستجابة بشكل صحيح.
نصيحة 3: كن دقيقاً في استخدام لغة الكاميرا
لا تقلق بشأن الكتابة كثيراً. لقد أصبح فهم العارضة للغة الكاميرا قوياً جداً الآن.
الدفع، والسحب، والتحريك الأفقي، والتتبع، والتحريك الدائري، والتصوير المداري، واللقطات من الأعلى، واللقطات من زاوية منخفضة، واللقطات المتواصلة، وعدسات التكبير الخاصة بهيتشكوك، وعدسات عين السمكة. إنه يفهم كل هذه المصطلحات الاحترافية.
إذا لم تكن على دراية بالمصطلحات التقنية، فلا بأس بذلك أيضاً. فالأوصاف البسيطة تؤدي الغرض نفسه، مثل "تتحرك الكاميرا ببطء من خلف الشخصية إلى الأمام".
نصيحة رقم 4: أضف انتقالات للإجراءات المستمرة
إذا كنت تريد أن تقوم الشخصية بتنفيذ سلسلة من الإجراءات المتصلة، فتأكد من وصف الانتقالات بوضوح.
على سبيل المثال، "تنتقل الشخصية مباشرة من القفز إلى التدحرج، مما يحافظ على استمرارية الحركة وانسيابيتها". وهذا يساعد على تجنب القطع المفاجئة غير الطبيعية في الفيديو النهائي.
الخطوة 5. حدد المدة وقم بالإنشاء
اختر طول الفيديو الذي تحتاجه، في أي مكان بين 4 و 15 ثانية.

ملاحظة هامة:
إذا كنتَ تُطيل مدة فيديو موجود، مثلاً بإضافة خمس ثوانٍ إلى نهاية مقطع، فإن المدة التي تحددها هنا تُشير فقط إلى الجزء المُضاف حديثاً، وليس إلى طول الفيديو الإجمالي. إذا كنتَ ترغب في تمديد الفيديو بخمس ثوانٍ، فاختر خمس ثوانٍ.
ثم انقر فوق "إنشاء" وانتظر النتيجة.
إذا لم تكن راضيًا، فلا تتردد في إعادة المحاولة عدة مرات. تتضمن مخرجات الذكاء الاصطناعي عنصرًا من العشوائية، لذا حتى مع نفس المدخلات، قد تختلف كل نتيجة قليلاً. ما عليك سوى اختيار النسخة التي تفضلها.
نظرة معمقة على القدرات الأساسية لبرنامج Seedance 2.0
فيما يلي أقوى عشر قدرات لبرنامج Seedance 2.0. كل منها يأتي مع إرشادات استخدام عملية وأمثلة حقيقية.
القدرة 1. قفزة نوعية في الجودة البصرية
لنبدأ بالأساسيات.
خضعت لعبة Seedance 2.0 لتحديث شامل وأساسي. أصبحت الفيزياء أكثر دقة، والحركات أكثر سلاسة، والأنماط البصرية أكثر اتساقًا في جميع أنحاء المشهد.
في أبسط مستويات توليد الصور، حدثت قفزة نوعية:
- فيزياء أكثر واقعية : حركة الملابس، ورذاذ الماء، واصطدامات الأجسام كلها تتصرف بشكل طبيعي أكثر.
- حركة أكثر سلاسة وطبيعية : لم يعد المشي والجري وحتى الحركات المعقدة تبدو متصلبة أو آلية.
- فهم التعليمات بشكل أكثر دقة : إذا قلت "فتاة تعلق الملابس برشاقة"، فإنها تفهم حقًا معنى كلمة "برشاقة".
- اتساق أسلوب أكثر استقرارًا : يظل الأسلوب البصري متماسكًا من البداية إلى النهاية، دون تحول مفاجئ.

مثال على الاستخدام
تقوم فتاة برشاقة بتعليق الملابس لتجف. بعد الانتهاء من قطعة واحدة، تأخذ قطعة أخرى من دلو وتهزها بقوة.
ماذا يعني هذا عملياً؟
عندما تقوم بإنشاء مشهد مثل "فتاة تعلق الملابس برشاقة، ثم تأخذ ملابس أخرى من دلو وتهزها بقوة"، فإن حركة القماش، والقوة في ذراعيها، وملمس القماش كلها تبدو قريبة بشكل ملحوظ من اللقطات الحقيقية.
كما أن المشاهد الأكثر تعقيداً في متناول اليد أيضاً.
تتبع الكاميرا رجلاً يرتدي ملابس سوداء وهو يركض بسرعة عالية. يطارده مجموعة من الناس من الخلف. ثم تنتقل الكاميرا إلى لقطة جانبية. في حالة من الذعر، يصطدم بكشك فواكه على جانب الطريق، ويسقط، ثم ينهض ويواصل الركض.
أصبح بالإمكان الآن إنشاء مشاهد تتضمن مطاردات واصطدامات وانتقالات ديناميكية للكاميرا بشكل متسق في الإصدار 2.0.
بل إن هناك أمثلة أكثر تطرفاً. فقد استخدم بعض المبدعين إشارة واحدة فقط ليجعلوا شخصية داخل لوحة فنية تمد يدها سراً لتلتقط علبة كولا، ثم ترتشف رشفة، وتعيدها بسرعة عند سماعها خطوات، ثم ينتقل المشهد إلى لقطة أخيرة تقترب من خلفية سوداء لا يظهر فيها سوى علبة الكولا مع ترجمة فنية. كان هذا المستوى من التعقيد السردي شبه مستحيل تصوره في السابق.
القدرة الثانية: الجمع الحر بين وسائل النقل المتعددة
هذا هو التحديث الأهم في الإصدار 2.0. يمكنك الآن استخدام أي نوع من المواد كمرجع.
يمكن تلخيص الصيغة على النحو التالي:
Seedance 2.0 = مرجعية متعددة الوسائط + توليد إبداعي قوي + فهم دقيق للتعليمات
يمكنك الرجوع إلى:
- الإجراءات والتأثيرات والتنسيقات المرئية
- حركة الكاميرا ولغة اللقطة
- مظهر الشخصية وأسلوب المشهد
- الصوت والإيقاع الموسيقي

نصائح عملية
| ما الذي تريد فعله | كيفية كتابة السؤال |
| لدي صورة إطار رئيسي وأريد الإشارة إلى حركة الفيديو | "@Image 1 كإطار رئيسي، مع الإشارة إلى اهتزاز الكاميرا من @Video 1" |
| تمديد فيديو موجود | "تمديد الفيديو 1 بمقدار 5 ثوانٍ" (ضبط مدة الإنشاء على 5 ثوانٍ) |
| دمج عدة مقاطع فيديو | "أضف مشهدًا بين الفيديو 1 والفيديو 2، المحتوى هو xxx" |
| استخدم الصوت من مقطع فيديو | لا حاجة لتحميل الصوت بشكل منفصل، فقط قم بالإشارة إلى الفيديو مباشرة |
| العمل المستمر | "تنتقل الشخصية مباشرة من القفز إلى التدحرج، حافظ على الحركة سلسة ومتواصلة" |
القدرة الثالثة: تحسين كبير في الاتساق
أي شخص عمل مع فيديوهات الذكاء الاصطناعي يعرف أن الاتساق هو المشكلة الأكثر إحباطًا.
تتغير الوجوه بين اللقطات، وتختفي تفاصيل المنتج عند تغيير زاوية التصوير، وتنتقل أنماط المشاهد فجأة.
يبذل الإصدار 2.0 جهداً جاداً لحل هذه المشكلة.
بعد تحميل صورة مرجعية للشخصية، يظل مظهرها وملابسها ووضعيتها ثابتة طوال الفيديو. وينطبق الأمر نفسه على عروض المنتجات. فعند تدوير الحقيبة من زوايا متعددة، تبقى تفاصيلها الأمامية والجانبية وخامتها كما هي.
العناصر التي يمكن أن تظل متسقة:
- ملامح الوجه (بنية الوجه، لون البشرة، أسلوب التعبير)
- تفاصيل الملابس (النسيج، اللون، النقوش)
- عناصر العلامة التجارية (الشعار، الطباعة، نظام الألوان)
- أسلوب المشهد (الإضاءة، الجو العام، درجة اللون)
مثال على الاستخدام
رجل (@Image1) يسير في ممر بعد العمل، يبدو عليه الإرهاق. تباطأت خطواته. توقف عند باب منزله، أخذ نفسًا عميقًا ليستجمع قواه، بحث عن مفاتيحه، فتح الباب، ودخل. ركضت نحوه ابنته الصغيرة وكلبه الأليف بسعادة وعانقاه.

من خلال الإشارة إلى @Image1، يظل مظهر الشخصية متسقًا طوال التسلسل بأكمله.
القدرة الرابعة: محاكاة دقيقة لحركة الكاميرا والحركة
هذه إحدى أكثر ميزات الإصدار 2.0 التي تم الحديث عنها.
في الماضي، إذا كنت تريد أن يقوم الذكاء الاصطناعي بتقليد حركة الكاميرا السينمائية، فإما أن تكتب قائمة طويلة من المصطلحات التقنية وتأمل في الأفضل، أو ببساطة لن ينجح الأمر.
الآن الأمر لا يتطلب سوى خطوتين:
قم بتحميل فيديو مرجعي بحركة الكاميرا التي تعجبك، ثم اكتب:
"راجع حركة الكاميرا من الفيديو رقم 1."
يقوم النموذج بتحليل منطق الكاميرا في الفيديو المرجعي (الدفع، السحب، التحريك، التتبع، الدوران، التكبير، اللقطة المستمرة، إلخ) ويطبق نفس أسلوب الحركة على المحتوى الجديد الخاص بك.

حركات الكاميرا التي يمكن محاكاتها:
- تكبير هيتشكوك
- لقطة تتبع المدار
- لقطة واحدة متواصلة
- لقطات الدفع / السحب / التحريك / التتبع
- لقطة من زاوية منخفضة
- منظر علوي من منظور عين الطائر
مثال: إعادة تمثيل مشهد كلاسيكي من أفلام الووشيا
القدرة الخامسة: إعادة إنشاء دقيقة للقوالب والتأثيرات الإبداعية
هل رأيت فكرة إعلانية رائعة، أو تأثير انتقالي مميز، أو مقطع فيديو أعجبك؟
قم بتحميله مباشرةً كمرجع. يستطيع النموذج تحديد إيقاع الحركة، والبنية البصرية، ولغة الكاميرا فيه، ويساعدك على إعادة إنشاء نسختك الخاصة.

أنواع المحتوى الإبداعي التي يمكن إعادة إنشائها:
- انتقالات إبداعية، مثل تحطيم الألغاز، وتشتت الجسيمات، وانتقالات البوابات على نمط قزحية العين.
- أنماط الإعلانات النهائية
- تحرير إيقاعي على غرار الفيديو الموسيقي
- لقطات المؤثرات الخاصة السينمائية
- تأثيرات تغيير الملابس وتبديل الوجوه
مثال:
تم رفع مستوى المؤثرات الخاصة إلى أقصى حد...
القدرة السادسة: تمديد الفيديو واستمراره
هل لديك فيديو راضٍ عنه وتريد استكمال القصة؟ أو ربما تريد إضافة خلفية درامية قبل المقطع الحالي؟ ميزة تمديد الفيديو تُتيح لك القيام بالأمرين.
مدّ للأمام
قم بتحميل الفيديو الحالي واكتب "تمديد @Video 1 بمقدار X ثانية"، متبوعًا بوصف للمشاهد الجديدة التي تريد إنشاؤها.
مدّ للخلف
اكتب "تمديد X ثانية قبل" وأضف وصفًا للقصة السابقة التي تريد إنشاءها.
قواعد الاستخدام
أخبر النموذج بوضوح: "قم بتمديد الفيديو 1 بمقدار X ثانية".
عند إنشاء الفيديو، حدد مدة زمنية مساوية لطول التمديد. على سبيل المثال، إذا كنت ترغب في التمديد لمدة خمس ثوانٍ، فاختر خمس ثوانٍ كطول للإنشاء.
يمكنك تضمين عناصر حبكة جديدة وأوصاف مرئية في قسم الإضافة.
يدعم النظام كلاً من التمديد الأمامي والخلفي.
مثال على الاستخدام
من خلال الرجوع إلى الصور ومقاطع الفيديو، يمكن تمديد المقطع الأصلي الذي مدته ثانيتان أعلاه إلى خمس عشرة ثانية.
يمكن وصف الجزء الممتد بالتفصيل، بما في ذلك حركة الكاميرا والعناصر المرئية والنص الذي يظهر على الشاشة.
الميزة السابعة: صوت أكثر واقعية
تأتي مقاطع الفيديو التي تم إنشاؤها بواسطة الإصدار 2.0 مزودة بمؤثرات صوتية مدمجة وموسيقى خلفية، وقد تحسنت جودة الصوت الإجمالية بشكل ملحوظ مقارنة بالسابق.
فيما يلي بعض حالات الاستخدام المتعلقة بالصوت.
مرجع نبرة الصوت
قم بتحميل مقطع فيديو أو صوتي، ودع النموذج يقلد نبرة الكلام أو أسلوب السرد منه.
حوار متعدد اللغات
يستطيع الممثلون التحدث باللغات الصينية والإنجليزية والإسبانية والكورية وغيرها. ويُعالج التعبير العاطفي بشكل جيد للغاية.
حوار متعدد الشخصيات
يمكن أن يضم فيديو واحد عدة شخصيات، لكل منها حوارها الخاص. ومن الأمثلة الناجحة على ذلك برامج حوارية عن القطط والكلاب، وحوارات مسلسلات تاريخية، ومحادثات عسكرية تكتيكية.
دعم اللهجات
نجح بعض المبدعين في ابتكار شخصيات تتحدث بلهجة سيتشوان أثناء طلبها لشاي الحليب. والنتيجة تبدو واقعية بشكل مدهش.
مطابقة المؤثرات الصوتية
يمكن توليد أصوات خطوات الأقدام، والرعد، وضجيج الحشود، واصطدامات المعدات، وغيرها من الأصوات البيئية بدقة معقولة.
القدرة الثامنة: لقطات متماسكة أكثر من لقطة واحدة
يتطلب تصوير مشهد "بلقطة واحدة" أن يظل المشهد متصلاً لفترة طويلة مع التعامل مع التحولات المكانية المعقدة وحركة الكاميرا. لطالما شكل هذا تحدياً صعباً للذكاء الاصطناعي.
لقد حقق برنامج Seedance 2.0 تقدماً واضحاً في هذا المجال. فإذا قمت بتحميل صور متعددة من مشاهد مختلفة وكتبت عبارة مثل: "لقطة تتبع متواصلة تتبع عداءً من الشارع صعوداً على الدرج، عبر ممر، إلى سطح المبنى، ثم تطل على المدينة"، يستطيع البرنامج إكمال انتقالات طبيعية بين المشاهد دون فواصل ملحوظة.
كما يمكن تصوير مشاهد أكثر تعقيداً بلقطة واحدة. على سبيل المثال، "من منظور الشخص الأول، انظر من خلال نافذة الطائرة حيث تتحول الغيوم إلى آيس كريم، ثم اسحب الكاميرا إلى داخل المقصورة بينما يلتقط الشخص الآيس كريم ويأخذ قضمة."
حتى هذا النوع من التسلسل الذي يتم تصويره بلقطة واحدة، والذي يتضمن تغييرات في المنظور ومزيجًا من الواقعية والخيال، يمكن التعامل معه بواسطة برنامج Seedance 2.0.
تتضمن المشاهد أيضاً لقطات متواصلة على غرار أفلام التجسس والإثارة. تتبع الكاميرا عميلة ترتدي زياً أحمر وهي تشق طريقها عبر حشد من الناس. تنعطف عند زاوية فتصادف فتاة ملثمة، ثم تواصل المطاردة إلى قصر حيث يختفي الهدف، كل ذلك دون أي قطع في المشهد.
إن تحقيق هذا المستوى من الكثافة السردية في لقطة متواصلة أمر مثير للإعجاب بالفعل.
مثال على الاستخدام
@Image1 @Image2 @Image3 @Image4 @Image5، لقطة تتبع مستمرة تتبع عداءً من الشارع صعودًا على الدرج، عبر ممر، إلى سطح المبنى، وأخيرًا تطل على المدينة.
نصيحة
رتب عدة صور بالتسلسل. سيقدم النموذج هذه المشاهد بالترتيب ضمن اللقطة المتصلة.
القدرة التاسعة: تحرير الفيديو بالذكاء الاصطناعي
هل لديك فيديو بالفعل ولا ترغب في البدء من الصفر، بل تريد تعديل جزء منه فقط؟ يمكنك الآن استخدام فيديو موجود كمدخل وإجراء تعديلات محددة.
بديل الأحرف
استبدل الشخصية (أ) في الفيديو بالشخصية (ب) مع الحفاظ على الحركات والتعبيرات الأصلية دون تغيير. على سبيل المثال، "استبدل المغنية الرئيسية في الفيديو 1 بالمغني الرئيسي من الصورة 1، مع محاكاة الحركات الأصلية بالكامل."
انعكاس الحبكة
حافظ على المشهد والشخصيات كما هي، لكن أعد كتابة القصة بالكامل. بعض الكتّاب حوّلوا مشهدًا رومانسيًا لمشاهدة القمر على جسر إلى منعطف درامي حيث يدفع البطل البطلة إلى الماء. وآخرون حوّلوا مفاوضات متوترة في حانة إلى لحظة كوميدية حيث يُخرج أحدهم كيسًا ضخمًا من الوجبات الخفيفة.
تعديل العنصر
غيّر تسريحات الشعر، أو أضف دعائم، أو بدّل الخلفيات. على سبيل المثال، "غيّر تسريحة شعر المرأة في الفيديو 1 إلى شعر أحمر طويل، واجعل سمكة القرش الأبيض الكبيرة من الصورة 1 تظهر ببطء من منتصف الطريق خلفها".
تكامل العلامة التجارية
أضف عناصر العلامة التجارية إلى فيديو موجود. على سبيل المثال، أضف لقطة مقرّبة لكيس ورقي عليه شعار العلامة التجارية في فيديو دجاج مقلي.
مثال - استبدال الأحرف:
أعد تمثيل فيلم "الأسطورة السوداء: وكونغ"، ثم اجعله يقاتل كابتن أمريكا.
القدرة العاشرة: التحرير المتزامن مع الإيقاع
قم بتحميل فيديو موسيقي إيقاعي كمرجع. يستطيع النموذج اكتشاف تغيرات الإيقاع وجعل الانتقالات بين المشاهد تتم بدقة متناهية مع الإيقاع.
مزامنة الإيقاع الأساسية
قم بتحميل مواد الصور وفيديو مرجعي للموسيقى، ثم اكتب:
"قم بمزامنة العناصر المرئية مع إيقاع الفيديو."
مزامنة الإيقاع الديناميكية
يكتب:
"اجعل الشخصيات أكثر ديناميكية، وعزز الأسلوب البصري الحالم بشكل عام، وزد من التوتر البصري، واضبط حجم اللقطة حسب الحاجة بناءً على الموسيقى."
مزامنة إيقاع المناظر الطبيعية
عند دمج صور متعددة للمناظر الطبيعية مع الموسيقى، اكتب:
"تستوحي مشاهد المناظر الطبيعية إيقاعها من @Video وتتزامن الانتقالات مع الأسلوب المرئي وإيقاعات الموسيقى."

مثال على الاستخدام
@Image1 @Image2 @Image3 @Image4 @Image5 @Image6 @Image7
قم بمزامنة هذه الصور وفقًا لمواضع الإطارات الرئيسية والإيقاع العام للفيديو. اجعل الشخصيات أكثر حيوية، وأضف لمسة حالمة إلى الأسلوب البصري العام.
الصيغة الرئيسية
صور متعددة + فيديو مرجعي واحد للإيقاع + "مزامنة مع الإيقاع".
القدرة 11: أداء عاطفي أكثر إقناعًا
لطالما كانت تعابير الوجه الجامدة والانتقالات العاطفية غير الموفقة من المشكلات الشائعة في مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي. ويُظهر الإصدار 2.0 تحسناً واضحاً في هذا الجانب.
يمكنك تحميل فيديو كمرجع عاطفي، والسماح للعارضة بتقليد التغيرات التعبيرية فيه. على سبيل المثال: "تتجه المرأة في الصورة رقم 1 نحو المرآة، وتتوقف للحظة، ثم تنهار فجأة صارخة. يجب أن يعكس فعل الإمساك بالمرآة وشدة الانهيار العاطفي الفيديو رقم 1 بشكل كامل."

يمكنك أيضًا وصف التحولات العاطفية بدقة في النص. على سبيل المثال، الانتقال من اللطف إلى البرود، أو من التوتر إلى الاسترخاء، أو من الغضب إلى الارتياح. يستطيع النموذج فهم هذه التغيرات العاطفية وعكسها من خلال تعابير الوجه ولغة الجسد ونبرة الصوت.
بل ويمكنه التعامل مع التعبيرات المبالغ فيها ذات الطابع الكوميدي. على سبيل المثال، "ينظر الشخص فجأة إلى الأعلى ويبدأ بالصراخ بصوت عالٍ".