Google Veo 3 리뷰: Google Veo 3 직접 테스트해보고 솔직한 의견을 공유합니다.

최근 구글의 최신 AI 비디오 기술인 Veo 3 체험해 볼 기회가 있었습니다. Veo 3는 2025년 5월 20일 구글 I/O 2025 행사 에서 공개되었습니다.

이 모델의 멋진 기능들 덕분에 많은 화제가 되었습니다. AI 영상 제작 분야에 종사하는 사람으로서, 저는 이 모델에 대한 솔직한 생각과 경험을 공유하고 싶습니다.

요약

Veo 3 사용해 팟캐스트와 여러 콘서트 영상을 제작해 봤습니다. 완벽하진 않고 몇 가지 이상한 오류가 있긴 하지만, 사실적인 영상과 동기화된 오디오를 만들어내는 능력은 인상적이었습니다.

하지만 이 모델 때문에 답답함을 느낄 때도 있었습니다. 오디오 및 자막 생성 기능을 완전히 제어할 수 없고, 생성된 텍스트가 자주 오류가 발생했기 때문입니다.

장점	단점
✔️ 비디오와 오디오를 한 번에 생성합니다	❌ 매우 비싼 구독 플랜
✔️ 사실적인 입술 움직임과 음향 효과	❌ 제어되지 않는 오디오 및 자막 생성
✔️ 뛰어난 물리 엔진을 탑재한 고품질 그래픽	❌ 자주 눈에 띄는 불규칙성과 뒤죽박죽된 텍스트
✔️ Google Flow 에 통합됨

영상, 음성, 내레이션, 립싱크… 이 모든 것을 한 번에

제가 가장 먼저 눈치챈 것은 Veo 3가 여러 비디오 제작 단계를 하나의 간단한 프로세스로 간소화했다는 점입니다.

Veo 3 사용할 때, 영상에 생동감을 불어넣어 주는 사운드에 정말 감탄합니다. 나무에서 지저귀는 새소리나 북적이는 도시 거리 소리 같은 주변 소음을 추가할 수 있어서 장면이 훨씬 더 현실감 있게 느껴집니다.

가장 인상적인 점은 등장인물의 입 움직임에 맞춰 대사를 생성하는 능력입니다. 너무나 자연스러워서 때로는 AI가 생성한 것인지 믿기 어려울 정도입니다.

AI 비디오 워크플로 재정의

이 새로운 멀티모달 기능은 이 모델의 가장 큰 장점 중 하나입니다. 이제 더 이상 음악을 따로 찾거나 음성 해설 및 립싱크를 따로 설정할 필요가 없습니다.

이는 사람들이 AI를 이용해 영상을 제작하는 방식을 바꿀 수 있습니다.

기존 작업 흐름: 비디오 생성 > 음성 해설/음향 효과/음악 생성 > 립싱크 > 편집.
Veo 3 의 새로운 워크플로: 텍스트 프롬프트만 입력하면 모든 작업이 완료됩니다.

생성 예시

Veo 3 최근 유행하는 동영상 요청을 어떻게 처리할지 궁금해서, 서로 다른 동영상 네 개를 생성해 달라고 요청했습니다.

첫 번째 예시에서는 미국으로 빠르게 확산되고 있는 타코에 대한 내용을 담은, 실제처럼 보이는 가짜 날씨 뉴스 앵커 발표를 요청했습니다.

영상이 생각보다 사실적이어서 놀랐습니다. 얼굴에 약간의 왜곡이 있긴 했지만, 아나운서는 실제 사람처럼 보였고 입 모양도 상당히 정확했습니다.

다음 사례는 실감 나게 생긴 말하는 고릴라가 영국 축구 경기를 관람하는 내용의 신기한 영상이었는데, 고릴라가 셀카봉을 들고 관중석에서 다른 팬들과 함께 심판의 불공정한 판정에 대해 시청자들에게 화를 내는 모습이었다.

이 결과는 꽤 재밌었습니다. 고릴라의 표정과 몸짓이 믿을 수 없을 정도로 생생하고 실감 나게 들렸기 때문입니다. 하지만 배경의 왜곡 현상은 여전히 눈에 띄었습니다.

세 번째 예시로, 채소를 반으로 자르면 속이 어떻게 보일지 궁금했습니다.

대체로 제가 요청한 대로 정확하게 구현되었지만, 무슨 이유인지 도구가 채소를 결정화시켜 버려서 제가 의도했던 시각적 사실감을 해쳤습니다. 그나저나 소리는 편안하네요.

마지막 예시로, 저는 Veo 3 1912년 4월 14일로 시간 여행을 떠난 여성이 뉴펀들랜드 근처 북대서양에서 타이타닉호가 침몰하기 직전 승객들에게 경고하려는 모습을 담은 시간 여행 영화 시퀀스를 제작해 달라고 요청했습니다.

이번에는 장면이 지나치게 과장되었고, 갑자기 사라지는 장면은 불필요하다고 생각했습니다. 솔직히 말해서, 상당히 임의적이고 부정확한 AI 비디오 렌더링이었습니다.

전반적으로 Veo 3 대체로 괜찮은 성능을 보여줬습니다. 다만, 응답 속도와 시각적 일관성 면에서 몇 가지 사소한 문제가 있었습니다. 따라서 때때로 재작업이 필요할 수도 있겠지만, 이 AI 모델은 바이럴 영상을 제작할 잠재력을 충분히 가지고 있다고 생각합니다.

Flow: 차세대 AI 비디오 제작의 미리보기

Google Veo 3 와 함께 Flow 출시했습니다 . Flow는 Veo 3 및 이전 버전의 비디오 모델과 다양한 AI 생성 및 편집 도구를 통합한 AI 비디오 스토리보드 플랫폼입니다.

스토리보드

스토리보드 개념 자체는 새로운 것이 아닙니다. Sora 처음 소개했지만, 성능이 떨어져서 주목받지 못했습니다. Google Flow 스토리보드 개념을 더욱 유용하게 만들어 줍니다.

Veo 제품군의 모델들이 업로드하거나 생성한 클립을 타임라인에 배치하고, 순서를 정하고, 다듬고, 기본적인 편집을 할 수 있습니다. 하지만 가장 멋진 기능은 바로 "확장" 기능입니다.

부드러운 비디오 확장

작동 방식은 다음과 같습니다. 8초짜리 비디오를 가져와서 아무 프레임이나 시작점으로 사용하여 해당 순간부터 이어지는 새로운 애니메이션을 생성할 수 있습니다.

놀라운 점은 원본 콘텐츠와 새로운 콘텐츠 사이의 전환이 얼마나 매끄러운지입니다. Flow 단순히 하나의 이미지를 참조로 사용하는 것이 아니라 원본 비디오의 움직임 추세를 분석하는 것 같습니다.

이 확장 기능은 AI가 생성하는 동영상의 일반적인 길이 제한을 뛰어넘기 때문에 매우 중요합니다. 이제 짧은 클립에만 국한되지 않고 더 길고 스토리가 풍부한 동영상을 제작할 수 있습니다.

Sora 약속했던 것과 비슷하지만, 구글의 구현 방식은 실제로 꽤 괜찮아서 유용하게 쓸 수 있습니다.

하지만 한 가지 유의할 점은 현재 확장 기능은 Veo 2 에서만 작동하고 최신 Veo 3 에서는 작동하지 않는다는 것입니다.

인상적이지만, 일관성이 부족하기도 하다

Veo 3 멋진 기능과 뛰어난 영상 품질에 상당히 기대가 컸습니다. 하지만 자세히 살펴보니, 제가 만든 일부 영상의 화질에 문제가 있다는 것을 알게 되었습니다.

제어되지 않는 오디오 및 자막 생성

정말 거슬렸던 점은 오디오와 자막 생성 방식이 너무 무작위적이라는 것이었습니다. 프롬프트에서 지정하더라도 오디오와 자막이 나타날지 여부를 제어할 수 없었습니다.

한 예로, 다음 프롬프트로 생성된 영상이 있습니다. 20세 소녀는 매우 당황한 표정으로 "무슨 일이죠? 제가 직접 쓴 에세이가 AI가 생성한 것으로 판명됐어요?"라고 말했습니다. 소녀는 머리에 손을 얹고 불안한 표정을 짓고 있으며, 자막은 없습니다.

저는 요청사항에 자막 없이 소녀가 말하는 장면만 넣어달라고 특별히 요청했습니다. 그런데 영상에는 자막만 나오고 아무 소리도 나지 않았습니다.

칫솔을 홍보하는 이 틱톡 영상 예시에서도 마찬가지로 소리가 들리지 않습니다.

특이사항 및 오류

Veo 3 로 생성된 영상에서 몇 가지 오류를 발견했습니다. 어색한 움직임이나 이해하기 어려운 시각적 오류 등이 그 예입니다.

예를 들어, 저는 노트북 개봉 영상을 만들려고 했습니다. 그런데 누군가가 실제로 상자를 열고 노트북을 꺼내는 모습을 보여주는 대신, 골판지 상자 자체가 노트북으로 변해버렸습니다!

Veo 2에서 나타났던 문제들이 새 버전에서도 여전히 남아 있다는 점은 실망스럽습니다.

또한, 전반적인 음질은 여전히 개선이 필요하고, 일부 효과음은 어색하게 들렸습니다. 사소한 문제이긴 하지만, 자세히 들어보면 거슬렸습니다.

뒤죽박죽된 텍스트

또 다른 문제는 텍스트 생성 품질이었습니다. Veo 3 동영상 자막을 생성할 수 있지만, 생성된 텍스트가 뒤죽박죽이거나 오타가 많은 경우가 잦았습니다.

이 문제는 앞의 예시에서도 확인할 수 있습니다. 그리고 이 문제가 얼마나 자주 발생하는지 보여주는 더 많은 예시를 아래에 제시합니다.

이 문제는 많은 AI 모델에서 흔히 발생하는 문제인 것으로 알고 있습니다. 하지만 앞서 언급했듯이 모델의 외형을 완전히 제어할 수는 없습니다. 따라서 이 문제를 피하려면 몇 번 더 생성해 보는 것이 좋습니다.

고가의 접근

또 다른 단점은 Veo 3 가 매우 비싸다는 점입니다. Veo 3는 월 249.99달러인 구글 울트라 요금제에 가입한 사용자만 이용할 수 있습니다.

가격이 너무 비싸네요. 일반 사용자나 소규모 크리에이터가 이 모델을 시험해보고 싶다면, 이 서비스는 적합하지 않을 것 같습니다. 앞으로 Google 접근성을 확대하거나 더 저렴한 옵션을 제공해주기를 바랍니다.

Veo 3 사용할 수 없습니까? Pollo AI 사용해 보세요!

고품질 AI 비디오 생성기를 찾고 있지만 Veo 3 에 접속할 수 없다면 Pollo AI 를 꼭 살펴보세요!

Pollo AI 는 강력한 올인원 AI 비디오 및 이미지 생성 플랫폼으로, 모든 최고의 비디오 모델을 한 곳에서 편리하게 사용해 볼 수 있습니다. Google Cloud의 공식 파트너인 Pollo AI 에서 Veo 3 사용해 보고 최첨단 기능을 직접 경험해 보세요!

Veo 3 외에도, 이 플랫폼을 통해 Veo 3.1 , Vidu, Hailuo, Kling, PixVerse 와 같은 최고급 모델들의 고유한 기능을 원활하게 전환하고 경험할 수 있습니다. 이를 통해 멋지고 고품질의 비디오를 제작하는 데 필요한 모든 고급 모델을 이용할 수 있습니다.

게다가 Pollo AI 모든 창작 요구 사항을 충족하는 포괄적인 자체 비디오 도구 모음을 제공합니다.

예를 들어, 혁신적인 이미지-비디오 AI, 텍스트-비디오 AI, 참조-비디오 변환 , 비디오-비디오 변환 AI 등을 사용해 볼 수 있습니다. 또한, 다양한 AI 비디오 효과를 적용하여 재미있고 상상력이 풍부한 AI 비디오를 제작할 수 있습니다.

마지막으로

AI 비디오 생성 도구를 대부분 사용해 본 사람으로서, Veo 3 제공하는 높은 품질에 정말 만족합니다.

자연스러운 오디오 통합, 사실적인 디테일, 간소화된 비디오 제작 과정, 이 모든 것들이 저에게 깊은 인상을 준 멋진 기능들입니다.

반면 가격이 접근성을 제한하며, 생성 품질과 일관성 측면에서 개선의 여지가 여전히 남아 있습니다.

그렇긴 하지만, Veo 3 AI 비디오 기술이 나아갈 방향을 엿볼 수 있는 흥미로운 기회를 제공하며, Google 비롯한 다른 회사들이 이 기반 위에 어떻게 기술을 발전시켜 나갈지 궁금합니다.

그리고 만약 올인원 AI 비디오 제작 플랫폼을 찾고 계신다면, Pollo AI 비디오 생성기를 한번 사용해 보시길 추천합니다!