เมื่อไม่นานมานี้ ผมมีโอกาสได้ลองใช้เทคโนโลยี AI สำหรับวิดีโอขั้นสุดยอดล่าสุดของ Google อย่าง Veo 3 ซึ่งเปิดตัวเมื่อวันที่ 20 พฤษภาคม 2025 ใน งาน I/O 2025 ของ Google
คุณสมบัติสุดเจ๋งของมันทำให้เกิดกระแสฮือฮาอย่างมาก และในฐานะคนที่ทำงานด้านการสร้างวิดีโอด้วย AI ผมก็อยากจะแบ่งปันความคิดเห็นและประสบการณ์ตรงของผมเกี่ยวกับโมเดลนี้

สรุปสั้นๆ
ฉันทดสอบ Veo 3 โดยการสร้างพอดแคสต์และวิดีโอคอนเสิร์ตหลายรายการ แม้ว่าจะไม่สมบูรณ์แบบและมีข้อผิดพลาดแปลกๆ อยู่บ้าง แต่ก็ประทับใจมากที่มันสร้างวิดีโอที่สมจริงและเสียงที่ซิงค์กันได้ดีขนาดนี้
แต่บางครั้งฉันก็รู้สึกหงุดหงิดกับโมเดลนี้เช่นกัน เพราะการสร้างเสียงและคำบรรยายไม่สามารถควบคุมได้อย่างเต็มที่ และข้อความที่สร้างขึ้นมักจะผิดเพี้ยน
| ข้อดี | ข้อเสีย |
| ✔️ สร้างวิดีโอและเสียงพร้อมกันในครั้งเดียว | ❌ แผนสมัครสมาชิกราคาแพงมาก |
| ✔️ การซิงค์ริมฝีปากและเอฟเฟกต์เสียงสมจริง | ❌ การสร้างเสียงและคำบรรยายที่ไม่สามารถควบคุมได้ |
| ✔️ ภาพกราฟิกคุณภาพสูง พร้อมระบบฟิสิกส์ที่สมจริง | ❌ พบความผิดปกติที่เห็นได้ชัดบ่อยครั้งและข้อความที่สับสน |
| ✔️ ผสานรวมเข้ากับ Google Flow แล้ว |
วิดีโอ เสียงพากย์ การซิงค์ริมฝีปาก ... ครบจบในครั้งเดียว
สิ่งแรกที่ผมสังเกตเห็นคือ Veo 3 ช่วยลดขั้นตอนการสร้างวิดีโอหลายขั้นตอนให้เหลือเพียงกระบวนการเดียวที่ง่ายดาย
เมื่อผมใช้ Veo 3 ผมรู้สึกทึ่งกับวิธีที่มันทำให้วิดีโอของผมมีชีวิตชีวาด้วยเสียง ผมสามารถเพิ่มเสียงบรรยากาศต่างๆ เช่น เสียงนกร้องบนต้นไม้ หรือเสียงผู้คนพลุกพล่านบนท้องถนนในเมือง ซึ่งทำให้ฉากต่างๆ ของผมดูสมจริงมากยิ่งขึ้น
สิ่งที่ทำให้ฉันประทับใจมากที่สุดคือความสามารถในการสร้างบทสนทนาที่ตรงกับการขยับริมฝีปากของตัวละคร มันดูเป็นธรรมชาติมากจนบางครั้งดูไม่เหมือนว่าสร้างขึ้นโดย AI
นิยามใหม่ของเวิร์กโฟลว์วิดีโอ AI
ความสามารถแบบมัลติโมดอลใหม่นี้เป็นหนึ่งในจุดเด่นสำคัญของรุ่นนี้อย่างแน่นอน คุณไม่จำเป็นต้องยุ่งยากกับการเลือกเพลงหรือหาเสียงพากย์และการซิงค์ริมฝีปากแยกต่างหากอีกต่อไป
สิ่งนี้อาจเปลี่ยนแปลงวิธีการสร้างวิดีโอด้วย AI ของผู้คน:
- ขั้นตอนการทำงานแบบเดิม: สร้างวิดีโอ > สร้างเสียงพากย์/เอฟเฟกต์เสียง/ดนตรี > การซิงค์ริมฝีปาก > การตัดต่อ
- ขั้นตอนการทำงานใหม่กับ Veo 3: เพียงแค่ป้อนข้อความ ระบบก็จะจัดการทุกอย่างให้เอง
ตัวอย่างการสร้าง
ผมอยากรู้ว่า Veo 3 จะรับมือกับคำขอวิดีโอที่กำลังเป็นที่นิยมได้ดีแค่ไหน จึงขอให้มันสร้างวิดีโอที่ไม่ซ้ำกันสี่รายการ
ในตัวอย่างแรก ผมขอให้สร้างประกาศข่าวพยากอากาศปลอมที่ดูสมจริง โดยบรรยายถึงการรุกรานของทาโก้ที่กำลังเข้ามาในสหรัฐอเมริกาอย่างรวดเร็ว
ฉันรู้สึกประหลาดใจกับความสมจริงในระดับหนึ่ง แม้จะมีรอยบิดเบี้ยวบนใบหน้าบ้าง แต่ผู้ประกาศดูเหมือนจริงมาก และการขยับปากก็ค่อนข้างแม่นยำ
ตัวอย่างถัดมาเป็นวิดีโอแปลกใหม่ที่แสดงภาพกอริลลาพูดได้ที่ดูสมจริงกำลังชมการแข่งขันฟุตบอลนัดสำคัญของอังกฤษ โดยมันถือไม้เซลฟี่และบ่นอย่างโมโหใส่ผู้ชมเกี่ยวกับคำตัดสินที่ไม่เป็นธรรมของผู้ตัดสิน ขณะที่อยู่ในอัฒจันทร์ร่วมกับแฟนบอลคนอื่นๆ
ผลลัพธ์ที่ได้นั้นค่อนข้างตลก เพราะกอริลลาตัวนั้นดูและฟังดูเหมือนจริงอย่างเหลือเชื่อ ทั้งสีหน้าและท่าทางที่เป็นธรรมชาติ แต่ก็ยังมีรายละเอียดพื้นหลังที่ผิดเพี้ยนอยู่บ้างซึ่งยังคงสังเกตเห็นได้
สำหรับตัวอย่างที่สาม ผมอยากเห็นว่าจะมีลักษณะอย่างไรภายในผักหากถูกผ่าครึ่ง
โดยส่วนใหญ่แล้ว โปรแกรมทำตามคำสั่งของฉันได้อย่างแม่นยำ แต่ด้วยเหตุผลบางอย่าง โปรแกรมกลับสร้างภาพผักที่ดูเหมือนตกผลึก ซึ่งทำให้ความสมจริงทางภาพที่ฉันตั้งใจไว้ลดลงไป ส่วนเสียงประกอบนั้นฟังแล้วผ่อนคลายดีนะ
ในตัวอย่างสุดท้ายนี้ ผมขอให้ Veo 3 สร้างลำดับภาพยนตร์เกี่ยวกับการเดินทางข้ามเวลาของหญิงคนหนึ่งที่เดินทางย้อนกลับไปในวันที่ 14 เมษายน 1912 และพยายามเตือนผู้โดยสารบนเรือไททานิกเกี่ยวกับการจมของเรือในมหาสมุทรแอตแลนติกเหนือ ใกล้กับนิวฟาวนด์แลนด์
คราวนี้ ผมรู้สึกว่าฉากนั้นดูเกินจริงไปมาก และลำดับการหายตัวไปอย่างกระทันหันนั้นไม่จำเป็นเลย พูดตรงๆ คือมันเป็นการสร้างวิดีโอด้วย AI ที่ค่อนข้างสุ่มและไม่แม่นยำ
โดยรวมแล้ว Veo 3 ทำได้ค่อนข้างดีทีเดียว มีข้อผิดพลาดเล็กน้อยในเรื่องความรวดเร็วและความสม่ำเสมอของภาพ ดังนั้นอาจจำเป็นต้องมีการสร้างใหม่บ้างเป็นครั้งคราว แต่ฉันคิดว่าโมเดล AI นี้มีศักยภาพในการสร้างวิดีโอที่พร้อมสำหรับการแพร่กระจายอย่างรวดเร็ว
Flow: ตัวอย่างเบื้องต้นของการผลิตวิดีโอด้วย AI ยุคใหม่
Google เปิด Flow พร้อมกับ Veo 3 ซึ่งเป็นแพลตฟอร์มสร้างสตอรี่บอร์ดวิดีโอด้วย AI ที่ผสานรวม Veo 3 และรุ่นก่อนหน้า รวมถึงเครื่องมือสร้างและแก้ไขวิดีโอด้วย AI มากมาย

สตอรี่บอร์ด
แนวคิดเรื่องสตอรี่บอร์ดไม่ใช่เรื่องใหม่ Sora เคยนำเสนอมาก่อน แต่ถูกมองข้ามไปเนื่องจากประสิทธิภาพที่ไม่ดี Google Flow นำแนวคิดสตอรี่บอร์ดมาพัฒนาให้มีประโยชน์มากขึ้น
คุณสามารถวางคลิปใดๆ ที่คุณอัปโหลดหรือสร้างขึ้นโดยตระกูลโมเดล Veo ลงบนไทม์ไลน์ จัดเรียง ตัดแต่ง และทำการแก้ไขขั้นพื้นฐานได้ แต่ฟีเจอร์ที่เจ๋งที่สุดคือสิ่งที่พวกเขาเรียกว่า "ส่วนขยาย"
ส่วนขยายวิดีโอแบบราบรื่น
วิธีการทำงานก็คือ คุณนำวิดีโอความยาว 8 วินาทีมาใช้ และสามารถใช้เฟรมใดก็ได้เป็นจุดเริ่มต้นในการสร้างแอนิเมชั่นใหม่ที่ต่อเนื่องจากช่วงเวลานั้น

สิ่งที่น่าทึ่งคือการเปลี่ยนผ่านระหว่างเนื้อหาต้นฉบับและเนื้อหาใหม่นั้นราบรื่นมาก Flow ดูเหมือนจะวิเคราะห์แนวโน้มการเคลื่อนไหวในวิดีโอต้นฉบับมากกว่าที่จะใช้เพียงภาพนิ่งภาพเดียวเป็นจุดอ้างอิง
ฟีเจอร์เสริมนี้สำคัญมาก เพราะมันช่วย打破ข้อจำกัดด้านความยาวแบบเดิมๆ ของวิดีโอที่สร้างโดย AI แทนที่จะติดอยู่กับคลิปสั้นๆ ตอนนี้คุณสามารถสร้างวิดีโอที่ยาวขึ้นและมีเรื่องราวมากขึ้นได้แล้ว
มันคล้ายกับสิ่งที่ Sora สัญญาไว้ แต่การนำไปใช้งานของ Google นั้นใช้งานได้ดีพอที่จะเป็นประโยชน์
แต่สิ่งหนึ่งที่ควรทราบคือ ขณะนี้ฟีเจอร์ส่วนขยายใช้งานได้เฉพาะกับ Veo 2 เท่านั้น ไม่ใช่ Veo 3 รุ่นใหม่กว่า
น่าประทับใจ แต่ก็ไม่สม่ำเสมอ
ตอนแรกฉันตื่นเต้นมากกับฟีเจอร์เจ๋งๆ และวิดีโอคุณภาพเยี่ยม Veo 3 สามารถสร้างได้ แต่เมื่อลองใช้ไปเรื่อยๆ ฉันก็สังเกตเห็นว่าวิดีโอบางส่วนที่ฉันสร้างขึ้นมีปัญหาเรื่องคุณภาพ
รุ่นเสียงและคำบรรยายที่ควบคุมไม่ได้
สิ่งหนึ่งที่ทำให้ผมรู้สึกหงุดหงิดมากคือ การสร้างเสียงและคำบรรยายที่ดูสุ่มๆ คุณไม่สามารถควบคุมได้ว่าจะให้มันปรากฏหรือไม่ แม้ว่าคุณจะระบุไว้ในข้อความแจ้งเตือนแล้วก็ตาม
ตัวอย่างหนึ่งคือวิดีโอนี้ที่สร้างขึ้นจากข้อความนี้: หญิงสาวอายุ 20 ปีคนนี้รู้สึกไม่สบายใจมากและพูดว่า "เกิดอะไรขึ้นคะ? บทความที่ฉันเขียนเองถูกตัดสินว่าเป็นบทความที่สร้างโดย AI เหรอคะ?" หญิงสาวคนนี้เอามือแตะศีรษะ สีหน้าวิตกกังวล และไม่มีคำบรรยายใดๆ
ฉันระบุเจาะจงไว้ในคำขอแล้วว่าต้องการคลิปที่ผู้หญิงคนนั้นพูดอะไรบางอย่างโดยไม่มีคำบรรยาย แต่คลิปที่ส่งมากลับไม่มีเสียงอะไรเลยนอกจากคำบรรยาย
และในตัวอย่างวิดีโอ TikTok โปรโมตแปรงสีฟันนี้ คุณก็ไม่ได้ยินเสียงใดๆ เช่นกัน
ความแปลกประหลาดและข้อผิดพลาด
นอกจากนี้ ผมยังสังเกตเห็นความผิดปกติบางอย่างในวิดีโอที่สร้างโดย Veo 3 ด้วย เช่น การเคลื่อนไหวที่ดูไม่เป็นธรรมชาติ หรือภาพผิดเพี้ยนที่ไม่สมเหตุสมผล
ตัวอย่างเช่น ฉันลองสร้างวิดีโอแกะกล่องแล็ปท็อป แทนที่จะแสดงให้เห็นว่ามีคนเปิดกล่องและหยิบแล็ปท็อปออกมาจริงๆ กล่องกระดาษกลับกลายร่างเป็นแล็ปท็อปไปเลย!
น่าผิดหวังที่พบว่าปัญหาเหล่านี้จาก Veo 2 ยังคงมีอยู่ในเวอร์ชันใหม่
นอกจากนี้ ผมคิดว่าคุณภาพเสียงโดยรวมยังต้องปรับปรุงอีกมาก และเอฟเฟ็กต์เสียงบางอย่างฟังดูแปลกๆ ถึงแม้จะเป็นรายละเอียดเล็กน้อย แต่ก็สังเกตได้เมื่อผมฟังอย่างตั้งใจ
ข้อความที่สับสน
อีกปัญหาหนึ่งคือคุณภาพการสร้างข้อความ Veo 3 สามารถสร้างคำบรรยายสำหรับวิดีโอได้ แต่ข้อความที่ได้มักจะสับสนและเต็มไปด้วยคำสะกดผิด
คุณสามารถเห็นปัญหานี้ได้จากตัวอย่างก่อนหน้านี้ และนี่คือตัวอย่างเพิ่มเติมเพื่อแสดงให้เห็นว่าปัญหานี้เกิดขึ้นบ่อยแค่ไหน



ฉันเข้าใจว่านี่เป็นปัญหาที่พบได้ทั่วไปในโมเดล AI หลายๆ ตัว แต่ดังที่กล่าวไปแล้ว คุณไม่สามารถควบคุมรูปลักษณ์ของมันได้อย่างสมบูรณ์ ดังนั้นคุณอาจต้องลองสร้างโมเดลอีกหลายๆ ครั้งเพื่อหลีกเลี่ยงปัญหานี้
การเข้าถึงที่มีราคาแพง
ข้อเสียอีกอย่างที่ผมพบคือ Veo 3 มีราคาแพงมาก มีให้ใช้งานเฉพาะผู้ใช้ที่สมัครใช้แพ็กเกจ Ultra ของ Google เท่านั้น ซึ่งมีราคา 249.99 ดอลลาร์ต่อเดือน
ราคาสูงมากเลยครับ ถ้าคุณเป็นแค่ผู้ใช้งานทั่วไปหรือผู้สร้างคอนเทนต์รายเล็กๆ ที่อยากลองใช้โมเดลนี้ดู ผมว่ามันอาจจะไม่เหมาะกับคุณ หวังว่าในอนาคต Google จะขยายการเข้าถึงหรือเสนอตัวเลือกที่ราคาถูกกว่านี้นะครับ
ไม่สามารถใช้ Veo 3 ได้? ลอง Pollo AI!
หากคุณกำลังมองหาโปรแกรมสร้างวิดีโอ AI คุณภาพสูง แต่พบว่า Veo 3 เข้าถึงได้ยาก คุณควรลองพิจารณา Pollo AI ดู!
Pollo AI คือแพลตฟอร์มสร้างวิดีโอและภาพด้วย AI ที่ทรงพลังและครบวงจร ช่วยให้คุณทดลองใช้โมเดลวิดีโอที่ดีที่สุดทั้งหมดได้ในที่เดียวอย่างสะดวกสบาย ในฐานะพันธมิตรอย่างเป็นทางการของ Google Cloud คุณสามารถ ทดลองใช้ Veo 3 บน Pollo AI และสัมผัสกับความสามารถล้ำสมัยได้ด้วยตนเองแล้ว!

นอกจาก Veo 3 แล้ว แพลตฟอร์มนี้ยังช่วยให้คุณสลับใช้งานและสัมผัสกับความสามารถพิเศษของรุ่นระดับสูงอื่นๆ ได้อย่างราบรื่น เช่น Veo 3.1 , Vidu, Hailuo, Kling และ PixVerse ซึ่งจะช่วยให้คุณเข้าถึงรุ่นขั้นสูงทั้งหมดที่จำเป็นในการสร้างวิดีโอคุณภาพสูงที่น่าทึ่ง
ยิ่งไปกว่านั้น Pollo AI ยังมีชุดเครื่องมือวิดีโอแบบครบวงจรเพื่อตอบสนองทุกความต้องการด้านความคิดสร้างสรรค์ของคุณ
ตัวอย่างเช่น คุณสามารถลองใช้ AI แปลงภาพเป็นวิดีโอ AI แปลงข้อความเป็นวิดีโอ AI แปลงข้อมูลอ้างอิงเป็นวิดีโอ AI แปลงวิดีโอเป็นวิดีโอ และอื่นๆ อีกมากมาย นอกจากนี้ คุณยังสามารถใช้เอฟเฟ็กต์วิดีโอ AI หลายแบบเพื่อสร้างวิดีโอ AI ที่สนุกสนานและสร้างสรรค์ได้ทุกรูปแบบ
ข้อคิดส่งท้าย
ในฐานะคนที่เคยลองใช้เครื่องมือสร้างวิดีโอด้วย AI มาหลายตัวแล้ว ผมรู้สึกตื่นเต้นมากกับคุณภาพที่สูงมาก Veo 3
การผสานเสียงที่เป็นธรรมชาติ รายละเอียดที่สมจริง และกระบวนการสร้างวิดีโอที่ราบรื่น ทั้งหมดนี้เป็นคุณสมบัติที่ยอดเยี่ยมที่ทำให้ฉันประทับใจมาก
ในทางกลับกัน ราคาที่สูงก็เป็นข้อจำกัดในด้านการเข้าถึง และยังคงมีช่องว่างให้ปรับปรุงในด้านคุณภาพและความสม่ำเสมอของการผลิตสัญญาณ
ถึงกระนั้น Veo 3 ก็ยังทำให้ผมได้เห็นภาพที่น่าสนใจว่าเทคโนโลยีวิดีโอ AI กำลังมุ่งหน้าไปในทิศทางใด และผมก็อยากรู้ว่า Google และบริษัทอื่นๆ จะต่อยอดจากพื้นฐานนี้ได้อย่างไร
และถ้าคุณกำลังมองหาแพลตฟอร์มสร้างวิดีโอด้วย AI แบบครบวงจร ผมขอแนะนำให้ ลองใช้ Pollo AI Video Generator ดู ครับ!