เมื่อไม่นานมานี้ ผมมีโอกาสได้ทดลองใช้เทคโนโลยีวิดีโอ AI ก้าวล้ำล่าสุดของ Google อย่าง Veo 3 ซึ่งเปิดตัวเมื่อวันที่ 20 พฤษภาคม 2025 ใน งาน I/O 2025
ฟีเจอร์เจ๋งๆ ของมันสร้างกระแสฮือฮาอย่างมาก และในฐานะคนทำงานด้านการสร้างวิดีโอด้วย AI ผมอยากแบ่งปันความคิดและประสบการณ์ตรงของผมเกี่ยวกับโมเดลนี้

สรุปสั้นๆ
ผมทดสอบ Veo 3 โดยการสร้างพอดแคสต์และวิดีโอคอนเสิร์ตหลายรายการ ถึงแม้จะไม่สมบูรณ์แบบและมีข้อผิดพลาดแปลกๆ บ้าง แต่มันก็น่าประทับใจที่สามารถสร้างวิดีโอที่สมจริงและเสียงที่ซิงค์กันได้อย่างยอดเยี่ยม
แต่บางครั้งฉันก็รู้สึกหงุดหงิดกับโมเดลนี้เช่นกัน เนื่องจากการสร้างเสียงและคำบรรยายนั้นไม่สามารถควบคุมได้อย่างสมบูรณ์ และข้อความที่สร้างขึ้นก็มักจะผิดพลาด
ข้อดี | ข้อเสีย |
✔️ สร้างวิดีโอและเสียงในครั้งเดียว | ❌ แผนการสมัครสมาชิกราคาแพงมาก |
✔️ การลิปซิงค์และเอฟเฟกต์เสียงที่สมจริง | ❌ การสร้างเสียงและคำบรรยายที่ไม่สามารถควบคุมได้ |
✔️ ภาพคุณภาพสูงพร้อมฟิสิกส์ที่ดี | ❌ ข้อผิดพลาดที่มองเห็นได้บ่อยครั้งและข้อความสับสน |
✔️ รวมเข้ากับ Google Flow |
วิดีโอ, เสียง, พากย์เสียง, ลิปซิงค์, ... ทั้งหมดในครั้งเดียว
สิ่งแรกที่ฉันสังเกตเห็นคือวิธีที่ Veo 3 ช่วยปรับปรุงขั้นตอนการสร้างวิดีโอหลายขั้นตอนให้กลายเป็นกระบวนการง่ายๆ เพียงขั้นตอนเดียว
เมื่อใช้ Veo 3 ผมรู้สึกทึ่งมากที่มันทำให้วิดีโอของผมดูมีชีวิตชีวาด้วยเสียง ผมสามารถเพิ่มเสียงแวดล้อมอย่างเช่นเสียงนกร้องในต้นไม้ หรือเสียงอึกทึกครึกโครมบนท้องถนนในเมืองได้ ซึ่งทำให้ฉากของผมดูสมจริงมาก
สิ่งที่ทำให้ฉันประทับใจมากที่สุดคือการที่มันสามารถสร้างบทสนทนาที่เข้ากับการเคลื่อนไหวของริมฝีปากของตัวละครได้ ซึ่งเป็นธรรมชาติมากจนบางครั้งดูไม่เหมือนว่าถูกสร้างโดย AI
เวิร์กโฟลว์วิดีโอ AI ถูกกำหนดใหม่
ความสามารถแบบมัลติโหมดใหม่นี้เป็นหนึ่งในจุดเด่นสำคัญของรุ่นนี้อย่างแน่นอน คุณไม่จำเป็นต้องวุ่นวายกับเพลงหรือค้นหาเสียงพากย์และลิปซิงค์แยกกันอีกต่อไป
สิ่งนี้สามารถเปลี่ยนแปลงวิธีที่ผู้คนผลิตวิดีโอด้วย AI ได้:
- เวิร์กโฟลว์แบบเก่า: สร้างวิดีโอ > สร้างเสียงพากย์/เอฟเฟกต์เสียง/เพลง > ลิปซิงค์ > ตัดต่อ
- เวิร์กโฟลว์ใหม่กับ Veo 3: เพียงป้อนข้อความแจ้งเตือน แล้วทุกอย่างก็เสร็จเรียบร้อย
ตัวอย่างรุ่น
ฉันกระตือรือร้นที่จะดูว่า Veo 3 จะสามารถจัดการกับคำขอวิดีโอที่กำลังได้รับความนิยมบางรายการได้อย่างไร ฉันจึงขอให้มันสร้างวิดีโอเฉพาะสี่รายการ
ในตัวอย่างแรก ฉันขอให้ผู้ประกาศข่าวสภาพอากาศปลอมที่มีลักษณะเหมือนจริงประกาศข่าวการบุกรุกของทาโก้ที่กำลังเข้ามาในสหรัฐฯ อย่างรวดเร็ว
ฉันประหลาดใจมากที่ฟุตเทจนี้ดูกึ่งสมจริงมาก ถึงแม้จะมีสีหน้าบิดเบี้ยวไปบ้าง แต่ผู้บรรยายก็ดูสมจริงด้วยการลิปซิงค์ที่แม่นยำพอสมควร
ตัวอย่างต่อไปนี้เป็นวิดีโอแปลกใหม่ของกอริลลาที่ดูเหมือนจริงและสามารถพูดคุยได้ขณะเข้าชมการแข่งขันฟุตบอลรายการใหญ่ของอังกฤษ โดยมันถือไม้เซลฟี่และบ่นอย่างโกรธเคืองต่อผู้ชมเกี่ยวกับการตัดสินที่ไม่ยุติธรรมของกรรมการในขณะที่อยู่บนอัฒจันทร์ร่วมกับแฟนๆ คนอื่นๆ
นี่เป็นผลลัพธ์ที่ตลกมาก เพราะกอริลลามีรูปลักษณ์และเสียงที่สมจริงอย่างเหลือเชื่อ ทั้งการแสดงออกและการเคลื่อนไหวของร่างกายที่เป็นธรรมชาติ แต่ก็ยังมีความผิดเพี้ยนของพื้นหลังอยู่บ้างซึ่งยังคงสังเกตเห็นได้
สำหรับตัวอย่างที่สาม ฉันต้องการดูว่าถ้าผักถูกผ่าครึ่งจะดูเป็นอย่างไร
ส่วนใหญ่แล้ว คำสั่งของฉันถูกทำตามได้อย่างแม่นยำ แต่ด้วยเหตุผลบางอย่าง เครื่องมือนี้กลับแสดงผลผักที่ตกผลึกออกมา ซึ่งส่งผลกระทบต่อความสมจริงของภาพที่ฉันต้องการ เสียงก็ผ่อนคลายดีเหมือนกันนะ
ในตัวอย่างสุดท้ายนี้ ฉันขอให้ Veo 3 สร้างลำดับภาพยนต์เกี่ยวกับการเดินทางข้ามเวลาของผู้หญิงคนหนึ่งที่ย้อนเวลากลับไปในวันที่ 14 เมษายน พ.ศ. 2455 และพยายามเตือนผู้โดยสารบนเรือไททานิกเกี่ยวกับเรือที่จมลงในมหาสมุทรแอตแลนติกเหนือ ใกล้กับนิวฟันด์แลนด์
ครั้งนี้ผมรู้สึกว่าฉากนี้ดูเกินจริงไปมาก และลำดับการหายไปอย่างกะทันหันก็ไม่จำเป็นเลย จริงๆ แล้วมันเป็นวิดีโอเรนเดอร์ AI ที่ค่อนข้างสุ่มและไม่แม่นยำ
โดยรวมแล้ว Veo 3 ทำได้ค่อนข้างดีโดยรวม แม้จะมีข้อบกพร่องเล็กน้อยในเรื่องความรวดเร็วและความสม่ำเสมอของภาพ ดังนั้นอาจจำเป็นต้องสร้างใหม่เป็นครั้งคราว แต่ผมคิดว่าโมเดล AI นี้มีศักยภาพในการสร้างวิดีโอที่พร้อมเผยแพร่สู่สาธารณะ
Flow: การเปิดตัววิดีโอ AI รุ่นถัดไปแบบแอบๆ
Google เปิดตัว Flow ควบคู่ไปกับ Veo 3 ซึ่งเป็นแพลตฟอร์มสตอรี่บอร์ดวิดีโอ AI ที่ผสานรวม Veo 3 และโมเดลวิดีโอก่อนหน้า และเครื่องมือสร้างและแก้ไข AI มากมาย

สตอรี่บอร์ด
แนวคิดสตอรี่บอร์ดไม่ใช่เรื่องใหม่ Sora เป็นคนแนะนำ แต่ถูกมองข้ามไปเพราะประสิทธิภาพไม่ดี Google Flow นำแนวคิดสตอรี่บอร์ดมาทำให้มีประโยชน์มากขึ้น
คุณสามารถวางคลิปใดๆ ที่คุณอัปโหลดหรือสร้างโดยโมเดลตระกูล Veo ลงบนไทม์ไลน์ จัดเรียง ตัดแต่ง และแก้ไขขั้นพื้นฐานได้ แต่ฟีเจอร์ที่เจ๋งที่สุดคือสิ่งที่เรียกว่า "ส่วนขยาย"
ส่วนขยายวิดีโอที่ราบรื่น
วิธีการทำงานเป็นดังนี้: คุณถ่ายวิดีโอความยาว 8 วินาที และใช้เฟรมใดก็ได้เป็นจุดเริ่มต้นในการสร้างแอนิเมชันใหม่ที่ต่อเนื่องมาจากช่วงเวลานั้น

สิ่งที่น่าทึ่งคือการเปลี่ยนผ่านระหว่างเนื้อหาต้นฉบับและเนื้อหาใหม่ได้อย่างราบรื่น Flow ดูเหมือนจะวิเคราะห์แนวโน้มการเคลื่อนไหวในวิดีโอต้นฉบับ แทนที่จะใช้ภาพเดียวเป็นข้อมูลอ้างอิง
ฟีเจอร์ส่วนขยายนี้สำคัญมาก เพราะสามารถข้ามขีดจำกัดความยาววิดีโอที่สร้างโดย AI ทั่วไปได้ แทนที่จะติดอยู่กับคลิปสั้นๆ คุณสามารถสร้างวิดีโอที่ยาวขึ้นและเล่าเรื่องได้มากขึ้น
มันคล้ายกับสิ่งที่ Sora สัญญาไว้ แต่การใช้งานของ Google นั้นก็ทำงานได้ดีเพียงพอที่จะเป็นประโยชน์ได้
แต่มีสิ่งหนึ่งที่ควรทราบ: ขณะนี้ฟีเจอร์ส่วนขยายจะใช้งานได้กับ Veo 2 เท่านั้น ไม่ใช่ Veo 3 ที่ใหม่กว่า
น่าประทับใจแต่ก็ไม่สม่ำเสมอ
ผมค่อนข้างตื่นเต้นกับฟีเจอร์เจ๋งๆ และวิดีโอสุดอลังการที่ Veo 3 มอบให้ แต่พอผมลองศึกษาเพิ่มเติม ผมสังเกตเห็นว่าวิดีโอบางรายการที่ผมสร้างมีปัญหาเรื่องคุณภาพด้วย
การสร้างเสียงและคำบรรยายที่ไม่สามารถควบคุมได้
สิ่งหนึ่งที่กวนใจผมมากคือเสียงและคำบรรยายที่สุ่มขึ้นมา เราไม่สามารถควบคุมได้ว่าเสียงและคำบรรยายจะปรากฏหรือไม่ แม้จะระบุไว้ในพรอมต์ก็ตาม
ตัวอย่างหนึ่งคือวิดีโอนี้ที่สร้างขึ้นด้วยคำกระตุ้นนี้: หญิงสาววัย 20 ปีรู้สึกทุกข์ใจมากและพูดว่า "เกิดอะไรขึ้น? เรียงความที่ฉันเขียนเองถูกระบุว่าสร้างโดย AI?" หญิงสาววางมือบนศีรษะ สีหน้าวิตกกังวล ไม่มีคำบรรยาย
ฉันขอให้ผู้หญิงคนนั้นพูดอะไรบางอย่างโดยไม่ใส่คำบรรยายในข้อความของฉัน วิดีโอออกมาเงียบสนิท แต่มีคำบรรยาย
และในวิดีโอตัวอย่างการโปรโมตแปรงสีฟันบน TikTok นี้ คุณจะไม่ได้ยินเสียงใดๆ เลย
ความแปลกประหลาดและข้อผิดพลาด
ฉันยังสังเกตเห็นข้อผิดพลาดบางอย่างในวิดีโอที่สร้างด้วย Veo 3 ซึ่งรวมถึงการเคลื่อนไหวที่ไม่เหมาะสมหรือภาพที่ไม่สมเหตุสมผล
ยกตัวอย่างเช่น ผมลองสร้างวิดีโอแกะกล่องแล็ปท็อป แทนที่จะให้คนเปิดกล่องแล้วหยิบแล็ปท็อปออกมาจริงๆ กล่องกระดาษแข็งกลับกลายเป็นแล็ปท็อปไปเลย!
น่าผิดหวังที่พบว่าปัญหาเหล่านี้จาก Veo 2 ยังคงมีอยู่ในเวอร์ชันใหม่
อีกอย่าง ผมคิดว่าคุณภาพเสียงโดยรวมยังต้องปรับปรุงอีกหน่อย และเอฟเฟกต์เสียงบางอย่างก็ฟังดูแปลกๆ แม้จะเล็กน้อยแต่ก็ยังรู้สึกได้เมื่อได้ยินใกล้ๆ
ข้อความสับสน
ปัญหาอีกประการหนึ่งคือคุณภาพของการสร้างข้อความ Veo 3 สามารถสร้างคำบรรยายสำหรับวิดีโอได้ แต่ข้อความมักจะออกมาไม่เป็นระเบียบและมีการสะกดผิดบ่อยครั้ง
คุณสามารถเห็นปัญหานี้ได้ในตัวอย่างก่อนหน้า และนี่คือตัวอย่างเพิ่มเติมที่จะแสดงให้คุณเห็นว่าปัญหานี้เกิดขึ้นบ่อยแค่ไหน



ฉันเข้าใจว่านี่เป็นปัญหาทั่วไปในโมเดล AI หลายโมเดล แต่อย่างที่กล่าวไปแล้ว คุณไม่สามารถควบคุมรูปลักษณ์ของโมเดลเหล่านั้นได้ทั้งหมด ดังนั้นคุณอาจต้องลองสร้างโมเดลใหม่อีกสักสองสามครั้งเพื่อหลีกเลี่ยงปัญหานี้
การเข้าถึงราคาแพง
ข้อเสียอีกอย่างที่ผมเจอคือ Veo 3 แพงมาก ใช้ได้เฉพาะผู้ใช้ที่สมัครแพ็กเกจ Ultra ของ Google ซึ่งราคา 249.99 ดอลลาร์ต่อเดือนเท่านั้น
ราคาค่อนข้างสูงทีเดียว ถ้าคุณเป็นแค่ผู้ใช้ทั่วไปหรือครีเอเตอร์รายย่อยที่อาจอยากทดลองใช้โมเดลนี้ ผมคิดว่ารุ่นนี้ไม่เหมาะกับคุณ หวังว่า Google จะขยายการเข้าถึงหรือเสนอตัวเลือกที่ราคาไม่แพงมากขึ้นในอนาคต
ไม่สามารถใช้ Veo 3 ได้? ลอง Pollo AI!
หากคุณกำลังมองหาเครื่องสร้างวิดีโอ AI คุณภาพสูงแต่ไม่สามารถลองใช้ Veo 3 ได้ ลองดู Pollo AI สิ!
Pollo AI คือเครื่องมือสร้างวิดีโอและรูปภาพ AI แบบครบวงจรอันทรงพลัง ที่ให้คุณทดลองใช้วิดีโอที่ดีที่สุดทั้งหมดได้ในที่เดียว ในฐานะพันธมิตรอย่างเป็นทางการของ Google Cloud คุณสามารถ ทดลองใช้ Veo 3 บน Pollo AI ได้แล้ว!

นอกจาก Veo 3 แล้ว คุณยังสามารถสัมผัสประสบการณ์ความสามารถของ Runway , Vidu , Hailuo , Kling , PixVerse , …, โมเดลขั้นสูงทั้งหมดที่คุณต้องการเพื่อสร้างวิดีโอคุณภาพสูงได้อีกด้วย
ยิ่งไปกว่านั้น Pollo AI ยังมีเครื่องมือวิดีโอหลากหลายเพื่อตอบสนองทุกความต้องการในการสร้างวิดีโอของคุณ
ตัวอย่างเช่น คุณสามารถลองแปลง ภาพเป็นวิดีโอ แปลงข้อความเป็นวิดีโอ แปลงวิดีโอตัวละครที่สอดคล้องกัน เครื่องสร้าง วิดีโอเป็นวิดีโอ และ เอฟเฟกต์วิดีโอ AI ต่างๆ เพื่อสร้างวิดีโอ AI ที่สนุกสนานและสร้างสรรค์ทุกประเภท
ความคิดสุดท้าย
เนื่องจากฉันเคยลองใช้เครื่องมือสร้างวิดีโอด้วย AI มาแล้วหลายตัว ฉันจึงรู้สึกตื่นเต้นมากกับคุณภาพสูงที่ Veo 3 มอบให้
การรวมเสียงที่เป็นธรรมชาติ รายละเอียดที่สมจริง และกระบวนการสร้างวิดีโอที่คล่องตัว เหล่านี้คือคุณสมบัติเจ๋งๆ ที่สร้างความประทับใจให้ฉันจริงๆ
ในทางกลับกัน ราคาจำกัดการเข้าถึง และยังคงมีช่องว่างสำหรับการปรับปรุงคุณภาพและความสม่ำเสมอของการผลิต
ถึงอย่างนั้น Veo 3 ยังคงทำให้ฉันมองเห็นภาพอันน่าสนใจว่าเทคโนโลยีวิดีโอ AI กำลังมุ่งหน้าไปทางไหน และฉันอยากรู้ว่า Google และบริษัทอื่นๆ จะสร้างรากฐานนี้ขึ้นมาได้อย่างไร
และนอกจากนี้ หากคุณกำลังมองหาแพลตฟอร์มสร้างวิดีโอด้วย AI แบบครบวงจร ฉันขอแนะนำให้คุณ ลองใช้ Pollo AI ดู !