Sora 2 ของ OpenAI ได้สร้างมาตรฐานใหม่ในการสร้างวิดีโอด้วย AI และ Google ก็อาจพร้อมที่จะตอบรับความท้าทายนี้
แม้ว่า Google จะยังไม่ได้ประกาศอย่างเป็นทางการ แต่สัญญาณเบื้องต้นบ่งชี้ว่า Veo 3.1 ซึ่งเป็นเวอร์ชันที่ปรับปรุงให้ดีขึ้นของโมเดลวิดีโอ AI ชั้นนำอย่าง Veo 3 อาจจะเปิดตัวในเดือนตุลาคม 2025
ให้มอง Veo 3.1 ว่าไม่ใช่การปฏิวัติ แต่เป็นการอัปเกรดที่ได้รับการปรับปรุงให้เหมาะสมอย่างยิ่ง — พร้อมคำสั่งที่ตอบสนองได้ดีขึ้น การปรับแต่งเฟรมเริ่มต้นและสุดท้าย ความสม่ำเสมอตามการอ้างอิง การผสานรวมเสียงที่แน่นแฟ้นยิ่งขึ้น การเคลื่อนไหวที่ราบรื่นยิ่งขึ้น และอื่นๆ อีกมากมาย
หากแนวโน้มปัจจุบันยังคงอยู่ Veo 3.1 อาจจะเข้ามาแทนที่ Veo 3 ทั้งหมดในไม่ช้า โดยทำงานภายใต้ชื่อเดียวกัน แต่ให้ผลลัพธ์ที่ดีขึ้นอย่างเห็นได้ชัดเบื้องหลัง
มาสำรวจสิ่งที่เราทราบ — และสิ่งที่เราคาดหวัง
สรุปอย่างรวดเร็ว: Veo 3 นำเสนออะไรบ้าง
Veo 3 ของ Google ถูกออกแบบมาเพื่อเป็นตัวสร้างวิดีโอจากรูปภาพและข้อความเป็นวิดีโอขั้นสูง สำหรับผู้สร้างเนื้อหาทั้งแบบมืออาชีพและโซเชียล
คุณสมบัติเด่น ได้แก่:
- การสร้างเสียงในตัว – เสียงพูด เสียงรอบข้าง และเพลงที่ซิงโครไนซ์กับวิดีโอที่สร้างขึ้น
- การผลิตเนื้อหาพร้อมสำหรับไวรัล – สเก็ตช์ "ข่าวปลอม" ขำขัน เอฟเฟกต์ย้อนเวลา คลิปเลียนแบบ — ออกแบบมาเพื่อการแชร์
- ความเข้าใจคำสั่งขั้นสูง – ตีความคำสั่งสร้างสรรค์ที่ซับซ้อนหลายส่วนได้อย่างแม่นยำ
- ความสม่ำเสมอของตัวละคร – ความสามารถในการใช้รูปภาพอ้างอิงเพื่อรักษาความต่อเนื่องทางสายตาสำหรับตัวละคร
- การควบคุมสไตล์ที่แม่นยำ – การจับคู่สไตล์ศิลปะจากรูปภาพอ้างอิง
- การควบคุมกล้อง – การจำลองการแพน ซูม และการเคลื่อนกล้องแบบภาพยนตร์อื่นๆ
- การจัดการวัตถุ – เพิ่มหรือลบวัตถุภายในฉากวิดีโอแบบไดนามิก
- การควบคุมการเคลื่อนไหวที่ยืดหยุ่น – การปรับความเร็วและเส้นทางการเคลื่อนที่ของวัตถุอย่างละเอียด
อ่านเพิ่มเติม: รีวิว Veo AI Video Generator ของ Google: ข้อมูลเชิงลึกอย่างละเอียดและเป็นส่วนตัว
การอัปเกรด ".1": การคาดการณ์คุณสมบัติใหม่ของ Veo 3.1
การอัปเดตเล็กน้อยคือทั้งหมดเกี่ยวกับการปรับปรุง หาก Veo 3 วางรากฐาน Veo 3.1 จะเกี่ยวกับการควบคุมการดำเนินการให้เชี่ยวชาญ นี่คือสิ่งที่เราสามารถคาดการณ์ได้อย่างสมจริงสำหรับการปรับปรุง:
เสียงในตัวที่อัปเกรด
การสร้างเสียงน่าจะเปลี่ยนจากการ "มีอยู่" ไปสู่ "การแสดงออก" ซึ่งอาจหมายถึงโทนอารมณ์ที่ละเอียดอ่อนยิ่งขึ้นในเสียงที่สร้างขึ้น การผสมเสียงรอบข้างที่ดีขึ้น และเสียงที่ไม่เพียงแค่เข้ากับการกระทำ แต่ยังช่วยเสริมบรรยากาศ
ความสมจริงและฟิสิกส์ที่ได้รับการปรับปรุง
เพื่อท้าทายคุณสมบัติเด่นของ Sora 2 โดยตรง Veo 3.1 จะต้องมุ่งเน้นไปที่การปรับปรุงเอนจิ้นฟิสิกส์อย่างแน่นอน คาดหวังการจำลองพื้นผิว การโต้ตอบของแสง และการชนกันของวัตถุที่ซับซ้อนได้อย่างแม่นยำยิ่งขึ้น
ความสม่ำเสมอตามการอ้างอิง
ความสามารถในการใช้รูปภาพหรือวิดีโออ้างอิงเพื่อรักษาตัวละครและสไตล์ศิลปะที่สม่ำเสมอในฉากต่างๆ ในขณะที่ Veo 3 สามารถรักษาความคล้ายคลึงของตัวละครได้ Veo 3.1 จะมุ่งสู่ความสม่ำเสมอที่ไร้ที่ติ
ซึ่งหมายความว่ารายละเอียดเล็กน้อย — เช่น รอยยับบนเสื้อหรือเส้นผม — จะยังคงสม่ำเสมออย่างสมบูรณ์แบบในฉากและมุมกล้องที่แตกต่างกัน
เฟรมแรกและเฟรมสุดท้าย
ส่วนขยายของการประมาณค่าของ Veo 3 การอัปเกรดนี้จะช่วยให้ผู้ใช้สามารถอัปโหลดรูปภาพเริ่มต้นและสิ้นสุดเพื่อสร้างการเปลี่ยนผ่านที่ลื่นไหล โดยเติมเต็มช่องว่างของเรื่องราวได้อย่างราบรื่น นึกถึงการใส่เรื่องราวด้วยภาพที่กำหนดเองสำหรับมิวสิควิดีโอหรือโฆษณา เพื่อให้แน่ใจว่า AI จะเชื่อมต่อภาพโดยไม่มีการตัดที่กระตุก
ความเร็วในการประมวลผล
สัญญาณเบื้องต้นบ่งชี้ว่า Veo 3.1 มีเวลาสร้างที่เร็วขึ้นเล็กน้อยเมื่อเทียบกับ Veo 3 แม้ว่า Sora 2 จะยังคงแข่งขันได้ในด้านนี้ ทั้งสองโมเดลแสดงถึงความก้าวหน้าที่สำคัญในการสร้างสมดุลระหว่างคุณภาพกับความเร็วในการสร้าง
Sora 2 ยกระดับมาตรฐานสำหรับวิดีโอ AI — Veo 3.1 ของ Google จะตามทันได้หรือไม่?
Sora 2 ของ OpenAI ซึ่งเปิดตัวเมื่อไม่กี่วันก่อนและพร้อมใช้งานแล้วผ่าน เครื่องมือสร้างวิดีโอ Pollo AI เป็นก้าวกระโดดที่ใหญ่กว่าเมื่อเทียบกับรุ่นก่อน ในหลายๆ ด้าน Veo 3.1 เป็นการอัปเดตการบำรุงรักษา ในขณะที่ Sora 2 ให้ความรู้สึกเหมือนเป็นการเปลี่ยนแปลงรุ่น
| คุณสมบัติ | Google Veo 3.1 (ประมาณการ) | OpenAI Sora 2 (ยืนยันแล้ว) |
| การจำลองฟิสิกส์ | ความสมจริงที่ดีขึ้น ส่วนใหญ่เป็นภาพ | เอนจิ้นฟิสิกส์เชิงลึก (แรงโน้มถ่วง การลอยตัว ความแม่นยำในการชน) |
| ความสม่ำเสมอของสถานะโลก | แข็งแกร่งในฉากเดียว | ยอดเยี่ยมในเรื่องราวหลายฉาก |
| การสร้างเสียง | เสียงในตัวที่ซิงโครไนซ์ | เสียงในตัวที่ซิงโครไนซ์เต็มรูปแบบ (เสียง + เพลง + เอฟเฟกต์) |
| ความเข้าใจคำสั่ง | ความแม่นยำสูง เหมาะอย่างยิ่งสำหรับคำสั่งภาพยนตร์ | ขั้นสูงอย่างยิ่ง จัดการตรรกะเชิงนามธรรม |
| ความสม่ำเสมอของตัวละคร | เชื่อถือได้ด้วยรูปภาพอ้างอิง | ความคงทนเกือบสมบูรณ์แบบในลำดับยาว |
| การปรากฏตัวของมนุษย์จริง ("Cameos") | ยังไม่ยืนยัน | ใช่ — ผู้ใช้สามารถแทรกและจัดการภาพลักษณ์ส่วนตัวได้ |
| การควบคุมกล้อง | คำสั่งภาพยนตร์ขั้นสูง | ยืดหยุ่น พร้อมพฤติกรรมที่เกิดขึ้น |
| การถ่ายโอนสไตล์ | ยอดเยี่ยมผ่านรูปภาพอ้างอิง | การควบคุมสูง รองรับโหมดศิลปะและภาพเหมือนจริง |
จุดเด่นที่ Sora 2 ทำได้ในขณะนี้:
- การจำลองฟิสิกส์ขั้นสูง – แรงโน้มถ่วง การลอยตัว การจัดการการชนที่สมจริง
- การเล่าเรื่องหลายฉากที่คงทน – รักษาความสม่ำเสมอของสถานะโลกข้ามฉาก
- การซิงโครไนซ์เสียงระดับไฮเอนด์ – เสียง เพลง เอฟเฟกต์ ตรงกับภาพอย่างสมบูรณ์แบบ
- ภาพลักษณ์ในโลกแห่งความเป็นจริง ("Cameos") – การฝังผู้คนลงในฉากที่สร้างขึ้นพร้อมการควบคุมสิทธิ์การใช้งาน
อ่านเพิ่มเติม: รีวิว Sora 2: ฉันได้ทดสอบโมเดลวิดีโอ AI ใหม่ของ OpenAI – ผลลัพธ์นั้นเหลือเชื่อ
จุดที่ Veo 3.1 อาจแข่งขันได้:
หากการตีความคำสั่งและการผสานรวม Flow ก้าวข้าม Sora 2 ไปได้ ก็อาจจะโดดเด่นในการสร้างสตอรี่บอร์ดที่ซับซ้อนและทำงานร่วมกัน
ไปป์ไลน์การจับคู่สไตล์ของ Google อาจจะตอบสนองความต้องการของโปรเจกต์สร้างสรรค์แบบไฮบริดที่ผสมผสานการถ่ายภาพ ภาพประกอบ และแอนิเมชันได้ดีกว่า
มุมมองเนื้อหาไวรัลของ Veo และพรีเซ็ตการเคลื่อนไหวของกล้องอาจดึงดูดผู้สร้างโซเชียลมีเดียที่กำลังมองหารูปแบบคลิปที่ให้ความบันเทิงมากกว่าความสมจริงแบบภาพยนตร์
มองไปข้างหน้า: Veo 3.1 จะเปิดตัวเมื่อใด?
ยังไม่มีการยืนยันกำหนดการอย่างเป็นทางการ แต่แหล่งข่าวชี้ว่าอาจจะเปิดตัวในช่วงปลายเดือนตุลาคม 2025 โดยอาจจะเริ่มจากผู้ใช้ระดับองค์กรผ่าน Google Cloud
หาก Veo 3.1 เป็นไปตามที่คาดหวัง ก็อาจจะตอกย้ำตำแหน่งของ Google ในการแข่งขันวิดีโอ AI โดยเฉพาะอย่างยิ่งเมื่อมีการผสานรวมกับ Android และ Wear OS สำหรับการสร้างบนอุปกรณ์
ผู้สร้างที่กระตือรือร้นที่จะทดลองอาจจับตาดูบล็อก Google DeepMind หรือการอัปเดต VideoFX
อย่ารอการเปิดตัวอย่างเป็นทางการ — Veo 3 สามารถเข้าถึงได้ผ่าน Pollo AI แล้วในตอนนี้ ให้คุณได้ลิ้มลองสิ่งที่จะเกิดขึ้น และเมื่อ Veo 3.1 เปิดตัว คุณจะเป็นหนึ่งในกลุ่มแรกๆ ที่ได้สัมผัส
เมื่อภูมิทัศน์ AI ร้อนแรงขึ้น สิ่งหนึ่งที่ชัดเจนคือ — ปี 2025 คือปีที่การสร้างวิดีโอกลายเป็นภาพยนตร์อย่างแท้จริง