홈페이지리뷰Google Veo 3 테스트해 보았고, 여기에 내 솔직한 의견이 있습니다.

Google Veo 3 테스트해 보았고, 여기에 내 솔직한 의견이 있습니다.

최근 구글의 최신 AI 비디오 기술인 Veo 3 체험해 볼 기회가 있었습니다. Veo 3는 2025년 5월 20일 구글 I/O 2025 행사 에서 공개되었습니다.

이 모델의 멋진 기능들은 많은 화제를 불러일으켰습니다. AI 영상 생성 분야에서 일하는 사람으로서, 이 모델에 대한 저의 솔직한 생각과 경험을 공유하고 싶습니다.

베오.jpg

요약

Veo 3 사용해서 팟캐스트와 여러 콘서트 영상을 생성해 봤습니다. 완벽하지는 않고 몇 가지 이상한 오류도 있지만, 사실적인 영상과 동기화된 오디오를 얼마나 잘 만들어내는지 놀랍습니다.

하지만 저는 이 모델 때문에 가끔 좌절감을 느꼈습니다. 오디오와 캡션 생성을 완벽하게 제어할 수 없었고, 생성된 텍스트가 엉망이 되는 경우가 많았습니다.

장점 단점
✔️ 한 번에 비디오와 오디오를 생성합니다 ❌ 매우 비싼 구독 플랜
✔️ 사실적인 립싱크와 사운드 효과 ❌ 제어되지 않는 오디오 및 캡션 생성
✔️ 뛰어난 물리 기반 고품질 비주얼 ❌ 자주 눈에 띄는 이상 현상과 뒤죽박죽 텍스트
✔️ Google Flow에 통합됨

비디오, 오디오, 음성 해설, 립싱크 등 모든 것을 한 번에

제가 가장 먼저 눈여겨본 점은 Veo 3가 여러 비디오 제작 단계를 하나의 간단한 프로세스로 간소화한다는 점이었습니다.

Veo 3 사용하면 사운드를 통해 영상에 생동감을 불어넣는 방식에 놀라곤 합니다. 나무 사이로 새들이 지저귀는 소리나 도시 거리의 북적이는 소리 같은 주변 소음을 추가하면 장면에 생동감을 더할 수 있습니다.

제가 가장 인상 깊었던 점은 캐릭터의 입술 움직임에 맞춰 대사를 만들어내는 능력입니다. 너무 자연스러워서 때로는 AI가 생성한 것 같지 않을 정도입니다.

AI 비디오 워크플로 재정의

이 새로운 멀티모달 기능은 분명 이 모델의 주요 특징 중 하나입니다. 더 이상 음악을 조작하거나 더빙과 립싱크를 따로 찾을 필요가 없습니다.

이는 사람들이 AI를 통해 비디오를 제작하는 방식을 바꿀 수 있습니다.

  • 이전 작업 흐름: 비디오 생성 > 음성 해설/음향 효과/음악 생성 > 립싱크 > 편집.
  • Veo 3 의 새로운 워크플로: 텍스트 프롬프트만 입력하면 모든 것이 자동으로 처리됩니다.

세대 예시

저는 Veo 3 특정 인기 영상 요청을 어떻게 처리할 수 있을지 궁금했기 때문에 4개의 고유한 영상을 생성해 달라고 요청했습니다.

첫 번째 예에서 저는 진짜처럼 보이는 가짜 날씨 뉴스 앵커의 발표를 요청했는데, 그 발표에서는 타코가 미국으로 급속히 유입되고 있다는 내용이 담겨 있었습니다.

영상이 얼마나 현실적으로 보이는지 놀랐습니다. 얼굴 왜곡이 좀 있긴 했지만, 아나운서는 꽤 정확한 립싱크를 하며 실제처럼 생생하게 보였습니다.

다음 예는 실제처럼 생긴 말하는 고릴라가 영국 축구 경기를 관람하는 신기한 영상입니다. 고릴라는 셀카봉을 들고 다른 팬들과 함께 관중석에 앉아 심판의 불공정한 판정에 대해 시청자들에게 화를 내며 떠듭니다.

고릴라의 자연스러운 표정과 몸짓이 믿을 수 없을 만큼 생생하게 표현되고 들려서 웃긴 결과였습니다. 하지만 눈에 띄는 배경 왜곡이 몇 가지 있었습니다.

세 번째 예에서는 야채를 반으로 자르면 내부가 어떻게 보일지 보고 싶었습니다.

대부분 제 지시를 정확히 따랐지만, 왠지 모르게 도구가 채소를 결정화시켜서 제가 의도했던 시각적 사실감이 떨어졌습니다. 그런데 소리는 편안하네요.

이 마지막 예에서 저는 Veo 3 1912년 4월 14일로 시간 여행을 하는 한 여성의 시간 여행 영화 시퀀스를 제작해 달라고 요청했고, 이 시퀀스에서 그녀는 뉴펀들랜드 근처 북대서양에서 타이타닉호가 침몰한다는 소식을 승객들에게 경고하려고 했습니다.

이번에는 장면이 너무 과장되었고, 갑자기 사라지는 장면은 불필요하다고 생각했습니다. 솔직히 말해서, AI 비디오 렌더링이 상당히 무작위적이고 부정확했습니다.

전반적으로 Veo 3 대부분 꽤 괜찮은 성과를 보였습니다. 다만, 빠른 반응 속도와 시각적 일관성에 몇 가지 문제가 있었습니다. 따라서 때때로 재생성이 필요할 수 있지만, 이 AI 모델은 바이럴 마케팅에 적합한 영상을 제작할 수 있는 역량을 갖추고 있다고 생각합니다.

Flow: 차세대 AI 영상 제작의 엿보기

Google Veo 3 와 함께 Flow를 출시했습니다 . Flow는 Veo 3 와 이전 비디오 모델, 그리고 다양한 AI 생성 및 편집 도구를 통합한 AI 비디오 스토리보드 플랫폼입니다.

흐름

스토리보드

스토리보드 개념은 새로운 것이 아닙니다. Sora 도입했지만, 성능 저하로 인해 간과되었습니다. Google Flow는 스토리보드 개념을 활용하여 훨씬 더 유용하게 만들었습니다.

Veo 모델 제품군에서 업로드하거나 생성한 모든 클립을 타임라인에 배치하고, 정렬하고, 트리밍하고, 기본적인 편집을 수행할 수 있습니다. 하지만 가장 멋진 기능은 바로 "확장" 기능입니다.

부드러운 비디오 확장

작동 방식은 다음과 같습니다. 8초 분량의 비디오를 촬영하고, 원하는 프레임을 시작점으로 삼아 그 순간부터 이어지는 새로운 애니메이션을 생성합니다.

연장하다

놀라운 점은 원본 영상과 새 영상 사이의 전환이 얼마나 자연스러운지입니다. Flow는 단일 이미지만 참조하는 것이 아니라 원본 영상의 동작 추세를 분석하는 것 같습니다.

이 확장 기능은 AI가 제작한 영상의 일반적인 길이 제한을 뛰어넘기 때문에 매우 중요합니다. 이제 짧은 클립에 얽매이지 않고, 더 길고 서사적인 영상을 제작할 수 있습니다.

이는 Sora 약속한 것과 비슷하지만, 구글의 구현은 실제로 유용할 만큼 충분히 잘 작동합니다.

하지만 주의할 점이 하나 있습니다. 현재 이 확장 기능은 Veo 2 에서만 작동하며, 최신 Veo 3 작동하지 않습니다.

인상적이지만 일관성이 없다

Veo 3 제공하는 멋진 기능과 멋진 영상에 꽤 기대가 컸습니다. 하지만 더 자세히 살펴보니 제가 제작한 일부 영상의 화질에 문제가 있다는 것을 알게 되었습니다.

제어되지 않는 오디오 및 자막 세대

정말 짜증 났던 건 오디오와 자막 생성이 너무 무작위로 느껴졌다는 거예요. 프롬프트에서 설정해도 표시 여부를 조절할 수가 없더라고요.

한 가지 예가 이 영상입니다. 이 영상은 다음과 같은 메시지로 제작되었습니다. 20대 여성이 매우 괴로워하며 "무슨 일이야? 내가 직접 쓴 에세이가 AI가 만든 것으로 판명됐어?"라고 말했습니다. 소녀는 머리에 손을 얹고 불안한 표정을 짓고 있지만, 자막은 없습니다.

저는 그 소녀가 뭔가 말하는 걸 원했는데, 제 프롬프트에는 자막이 없었어요. 영상은 완전히 무음으로 나왔지만, 자막은 있었어요.

그리고 칫솔을 홍보하는 이 TikTok 비디오 예시에서도 소리가 들리지 않습니다.

특이점과 결함

Veo 3 로 생성된 영상에서도 몇 가지 오류를 발견했습니다. 어색한 움직임이나 이해가 안 되는 시각적 오류 등이 여기에 포함됩니다.

예를 들어, 노트북 언박싱 영상을 만들어 봤습니다. 누군가 실제로 상자를 열고 노트북을 꺼내는 모습을 보여주는 대신, 골판지 상자 자체가 바로 노트북으로 변신했죠!

Veo 2의 이러한 문제가 새로운 버전에서도 여전히 남아 있다는 것은 실망스럽습니다.

또한 전반적인 음질은 아직 개선이 필요하고, 일부 음향 효과에서 이상한 소리가 났습니다. 사소한 문제였지만, 자세히 들어보니 여전히 눈에 띄었습니다.

뒤죽박죽 텍스트

또 다른 문제는 텍스트 생성 품질이었습니다. Veo 3 비디오 자막을 생성할 수 있지만, 텍스트가 뒤죽박죽 섞여 있고 철자 오류도 많았습니다.

이 문제는 이전 예시에서 확인할 수 있습니다. 그리고 이 문제가 얼마나 자주 발생하는지 보여주는 더 많은 예시를 소개합니다.

예 1
예 2
예시 3

이 문제가 많은 AI 모델에서 공통적으로 발생하는 문제라는 것을 알고 있습니다. 하지만 앞서 말씀드렸듯이 AI 모델의 모양을 완벽하게 제어할 수는 없습니다. 따라서 이 문제를 방지하려면 몇 번 더 생성을 시도해야 할 수도 있습니다.

비싼 접근성

제가 발견한 또 다른 단점은 Veo 3 가격이 너무 비싸다는 것입니다. 월 249.99달러인 Google Ultra 요금제에 가입한 사용자에게만 제공됩니다.

가격이 너무 비싸네요. 이 모델을 실험해 보고 싶은 일반 사용자나 소규모 크리에이터라면 이 모델은 적합하지 않다고 생각합니다. 앞으로 Google 접근성을 확대하거나 더 저렴한 옵션을 제공하기를 바랍니다.

Veo 3 사용할 수 없습니까? Pollo AI 사용해 보세요!

고품질 AI 비디오 생성기를 찾고 있지만 Veo 3 사용할 여유가 없다면 Pollo AI 를 살펴보세요!

Pollo AI 는 강력한 올인원 AI 비디오 및 이미지 생성기로, 최고의 비디오 모델을 모두 한 곳에서 시험해 볼 수 있습니다. Google Cloud의 공식 파트너로서, 이제 Pollo AI 에서 Veo 3 사용해 보세요 !

이미지-비디오-veo-3.jpg

Veo 3 외에도 Runway , Vidu , Hailuo , Kling , PixVerse 등의 기능을 모두 체험해 볼 수 있으며, 고품질 영상을 제작하는 데 필요한 모든 고급 모델도 사용할 수 있습니다.

게다가 Pollo AI 모든 비디오 제작 요구 사항을 충족할 수 있는 광범위한 비디오 도구를 제공합니다.

예를 들어, 이미지를 비디오로 , 텍스트를 비디오로 , 일관된 문자 비디오를 , 비디오를 비디오로 생성기, 그리고 다양한 AI 비디오 효과를 사용해 모든 종류의 재미있고 창의적인 AI 비디오를 제작할 수 있습니다.

마지막 생각

대부분의 AI 비디오 생성 도구를 사용해 본 사람으로서, 저는 Veo 3 제공하는 고품질에 정말 기대가 큽니다.

자연스러운 오디오 통합, 사실적인 디테일, 간소화된 비디오 제작 프로세스는 모두 저를 정말 감동시킨 멋진 기능입니다.

반면, 가격이 적용 범위에 제한을 두고 있으며, 세대별 품질과 일관성 측면에서 개선의 여지가 여전히 있습니다.

그럼에도 불구하고 Veo 3 AI 비디오 기술이 향하는 방향에 대한 흥미로운 통찰을 제공하며, Google 과 다른 회사가 이러한 기반을 어떻게 구축해 나갈지 궁금합니다.

또한, 만약 여러분이 올인원 AI 비디오 생성 플랫폼을 찾고 있다면, Pollo AI 한번 사용해보시는 걸 추천합니다!

관련 게시물

Flora AI를 테스트해 보았는데, 가치 있는 AI 이미지 및 비디오 도구일까요?

Flora AI(Flora Fauna AI)를 사용해 보고 싶으신가요? 이 AI 크리에이티브 디자인 플랫폼에 대한 리뷰를 읽고 어떤 기능을 제공하는지, 가장 큰 장점은 무엇인지, 그리고 현재 한계는 무엇인지 알아보세요!

Imagen 4 테스트해 봤습니다. Imagen 3 만큼 좋지는 않지만, 최대한 활용하는 방법은 다음과 같습니다!

Google DeepMind의 AI 이미지 생성 모델이 무엇을 할 수 있는지, 그리고 이 모델을 사용한 저의 개인적인 경험에 대해 자세히 알아보려면 Imagen 4 에 대한 리뷰를 확인하세요!

Hedra AI 테스트해 보았는데, 정말 고품질 AI 비디오를 제공할 수 있을까요?

Hedra AI 에 대한 모든 것을 여기에서 확인하세요! 이 AI 생성 플랫폼을 검토하고 기능을 테스트한 후, Pollo AI 사용해야 하는 이유를 포함하여 제가 얻은 모든 통찰력을 이 글에 정리했습니다!

Medeo AI의 올인원 멀티모달 콘텐츠 제작 기능을 테스트해 보았는데, 과연 과대광고에 걸맞은 제품일까요?

최신 AI 비디오 생성기 중 하나인 Medeo AI에 대한 리뷰를 읽어보세요. Medeo AI의 기능, 장점, 한계를 자세히 살펴보고, 제가 직접 사용해 본 경험을 공유해 드리겠습니다!