OpenAI의 Sora 2는 AI 영상 생성 분야에서 새로운 기준을 세웠으며, Google도 이 도전에 응할 준비가 된 것으로 보입니다.
Google은 아직 공식 발표를 하지 않았지만, 초기 신호에 따르면 플래그십 AI 영상 모델인 Veo 3의 개선된 버전인 Veo 3.1이 2025년 10월에 출시될 수 있습니다.
Veo 3.1을 혁신이라기보다는 고도로 최적화된 업그레이드로 생각합시다. 더 반응성이 좋은 프롬프트, 시작 및 끝 프레임 사용자 지정, 참조 기반 일관성, 긴밀한 오디오 통합, 더 부드러운 모션 등이 포함됩니다.
현재 추세가 유지된다면 Veo 3.1은 Veo 3를 완전히 대체할 수 있으며, 같은 이름으로 운영되면서도 눈에 띄게 개선된 결과를 제공할 것입니다.
알고 있는 것과 예상하는 것을 살펴보겠습니다.
간략 복습: Veo 3는 무엇을 가져왔습니까
Google의 Veo 3은 전문 및 소셜 콘텐츠 제작자를 대상으로 하는 고급 이미지-영상 및 텍스트-영상 생성기로 설계되었습니다.
주요 기능은 다음과 같습니다.
- 기본 오디오 생성 – 생성된 영상과 동기화된 내장 음성, 배경음, 음악.
- 바이럴 콘텐츠 제작 준비 완료 – 재미있는 "가짜 뉴스" 스킷, 시간 여행 효과, 패러디 클립 — 공유를 위해 설계됨.
- 고급 프롬프트 이해 – 복잡한 다중 부분 창의적 프롬프트를 정확하게 해석.
- 캐릭터 일관성 – 참조 이미지를 사용하여 캐릭터의 시각적 연속성을 유지하는 기능.
- 정확한 스타일 제어 – 참조 이미지의 예술적 스타일 일치.
- 카메라 제어 – 팬, 줌 및 기타 시네마틱 카메라 움직임 시뮬레이션.
- 객체 조작 – 동적으로 비디오 장면 내에서 피사체를 추가하거나 제거.
- 유연한 모션 제어 – 객체 이동 속도 및 경로 미세 조정.
더 읽기: Google Veo AI 영상 생성기 리뷰: 상세하고 개인적인 인사이트
".1" 업그레이드: Veo 3.1의 새로운 기능 예상
증분 업데이트는 개선에 관한 것입니다. Veo 3이 기반을 마련했다면, Veo 3.1은 실행을 마스터하는 데 중점을 둘 것입니다. 현실적으로 예상할 수 있는 개선 사항은 다음과 같습니다.
향상된 기본 오디오
오디오 생성은 단순히 "존재"하는 것에서 "표현력이 풍부한" 것으로 이동할 가능성이 높습니다. 이는 생성된 음성의 더 미묘한 감정 톤, 더 나은 분위기 믹싱, 그리고 단순히 액션과 일치하는 것이 아니라 분위기를 향상시키는 오디오를 의미할 수 있습니다.
향상된 현실감 및 물리
Sora 2의 주요 기능을 직접적으로 겨냥하여, Veo 3.1은 물리 엔진 개선에 거의 확실하게 초점을 맞출 것입니다. 텍스처, 조명 상호 작용 및 복잡한 객체 충돌에 대한 더 정확한 시뮬레이션을 기대합시다.
참조 기반 일관성
장면 전체에서 일관된 캐릭터와 예술적 스타일을 유지하기 위해 참조 이미지 또는 비디오를 사용할 수 있는 기능. Veo 3은 캐릭터의 유사성을 유지할 수 있었지만, Veo 3.1은 완벽한 지속성을 목표로 할 것입니다.
이는 셔츠의 특정 주름이나 머리카락 한 가닥과 같은 미묘한 세부 사항이 다른 장면과 카메라 각도에서도 완벽하게 일관되게 유지된다는 것을 의미합니다.
시작 및 끝 프레임
Veo 3의 보간 기능을 확장하여 사용자가 시작 및 끝 이미지를 업로드하여 부드러운 전환을 생성하고 내러티브 격차를 완벽하게 채울 수 있도록 합니다. 뮤직 비디오나 광고를 위한 맞춤형 비주얼로 스토리를 마무리하고 AI가 급격한 컷 없이 비주얼을 연결하도록 하는 것을 생각해봅시다.
처리 속도
초기 신호에 따르면 Veo 3.1은 Veo 3에 비해 생성 시간이 약간 향상되었지만, Sora 2는 이 영역에서 여전히 경쟁력이 있습니다. 두 모델 모두 품질과 생성 속도의 균형에서 상당한 발전을 나타냅니다.
Sora 2는 AI 영상의 기준을 높입니다 — Google의 Veo 3.1이 따라갈 수 있습니까?
OpenAI의 Sora 2는 며칠 전 출시되어 이제 Pollo AI 영상 생성기를 통해 사용할 수 있으며, 이전 버전에 비해 훨씬 더 큰 도약입니다. 여러 면에서 Veo 3.1은 유지 보수 릴리스인 반면, Sora 2는 세대 전환처럼 느껴집니다.
| 기능 | Google Veo 3.1 (예상) | OpenAI Sora 2 (확인됨) |
| 물리 시뮬레이션 | 현실감 향상, 주로 시각적 | 심층 물리 엔진 (중력, 부력, 충돌 정확도) |
| 월드 스테이트 일관성 | 단일 장면 전반에 걸쳐 강력함 | 다중 샷 내러티브 전반에 걸쳐 탁월함 |
| 오디오 생성 | 동기화된 기본 오디오 | 완전 동기화된 기본 오디오 (음성 + 음악 + FX) |
| 프롬프트 이해 | 높은 정확도, 시네마틱 큐에 탁월 | 매우 발전됨, 추상 논리 처리 |
| 캐릭터 일관성 | 참조 이미지로 신뢰할 수 있음 | 긴 시퀀스에서 거의 완벽한 지속성 |
| 실제 사람 카메오 | 확인되지 않음 | 예 — 사용자가 개인 외모를 삽입하고 관리할 수 있음 |
| 카메라 제어 | 고급 시네마틱 지시 | 유연하며, 새로운 동작 발생 |
| 스타일 전송 | 참조 이미지를 통해 탁월 | 높은 제어, 예술적 및 포토리얼 모드 지원 |
Sora 2가 현재 두각을 나타내는 부분:
- 고급 물리 시뮬레이션 – 현실적인 중력, 부력, 충돌 처리.
- 지속적인 멀티 샷 스토리텔링 – 장면 전체에서 월드 스테이트 일관성 유지.
- 고품질 오디오 동기화 – 음성, 음악, 효과가 비주얼과 완벽하게 맞춰짐.
- 실제 외모 ("카메오") – 사용 권한을 제어하면서 사람들을 생성된 장면에 포함.
더 읽기: Sora 2 리뷰: OpenAI의 새로운 AI 영상 모델을 테스트했습니다 – 결과는 비현실적입니다
Veo 3.1이 경쟁할 수 있는 부분:
프롬프트 해석 및 Flow 통합이 Sora 2를 능가한다면, 협업적이고 복잡한 스토리보드에서 뛰어날 수 있습니다.
Google의 스타일 매칭 파이프라인은 사진, 일러스트레이션, 애니메이션을 혼합하는 창의적인 하이브리드 프로젝트에 더 적합할 수 있습니다.
Veo의 바이럴 콘텐츠 각도와 카메라 움직임 사전 설정은 시네마틱 현실감보다는 엔터테인먼트 클립 형식을 찾는 소셜 미디어 제작자에게 더 매력적일 수 있습니다.
미래 전망: Veo 3.1은 언제 출시합니까?
공식적인 일정은 확인되지 않았지만, 소식통에 따르면 2025년 10월 말까지 출시될 가능성이 있으며, Google Cloud를 통해 엔터프라이즈 사용자를 대상으로 먼저 시작될 수 있습니다.
Veo 3.1이 과대 광고에 부응한다면, 특히 Android 및 Wear OS와 통합하여 온디바이스 생성을 지원하는 경우 AI 영상 경쟁에서 Google의 입지를 확고히 할 수 있습니다.
실험하고 싶어하는 제작자들은 Google DeepMind 블로그 또는 VideoFX 업데이트를 주시할 수 있습니다.
공식 출시를 기다리지 맙시다 – Veo 3은 지금 Pollo AI를 통해 액세스 가능하며, 다가올 것을 미리 맛볼 수 있습니다. Veo 3.1이 출시되면 가장 먼저 경험하는 사람들 중 하나가 될 것입니다.
AI 환경이 뜨거워짐에 따라 한 가지는 분명합니다. 2025년은 영상 생성이 진정한 시네마틱 시대로 접어드는 해가 될 것입니다.