AI 광고 영상을 만들 때 가장 흔하게 겪는 문제가 하나 있어요. 같은 제품인데 프레임마다 색상이나 형태가 조금씩 달라지거나, 등장 인물의 얼굴이 씬마다 바뀌는 것이죠. 광고 영상에서 시각적 일관성이 무너지면 브랜드 신뢰도도 같이 흔들립니다.
이 글에서는 Pollo AI의 Reference to Video 기능을 기준으로 설명할게요. 레퍼런스 이미지를 넣고, 프롬프트를 작성하고, 일관된 영상을 생성하는 흐름만 짧고 실용적으로 정리하겠습니다.
TL;DR — 이 글의 핵심 요약
제품·인물·브랜드 이미지를 레퍼런스로 넣으면 AI가 광고 영상 전반에 걸쳐 시각적 일관성을 자동으로 유지해 줍니다.
프레임마다 얼굴이 바뀌거나 제품 색상이 달라지는 기존 AI 영상의 고질적인 문제를, 레퍼런스 이미지 한 장으로 잡을 수 있어요.
촬영이나 편집 없이 이미지와 프롬프트만으로 광고 초안을 만들 수 있어서, 소규모 브랜드나 1인 셀러에게 특히 실용적입니다.
AI 광고 영상 만들기란?
AI 광고 영상 만들기는 제품 사진·인물 사진·브랜드 이미지를 레퍼런스로 입력하면 AI가 해당 요소를 영상 전반에 걸쳐 일관되게 유지하며 광고 영상을 자동 생성하는 방식입니다. 촬영·편집 없이 이미지 한 장만으로 시작할 수 있어서, 소규모 브랜드나 1인 셀러가 빠르게 광고 초안을 만들 때 특히 유용합니다.
Pollo AI의 Reference to Video는 업로드한 이미지를 기반으로 캐릭터 얼굴·제품 형태·브랜드 비주얼 톤을 일관되게 유지하면서 광고 영상을 생성합니다. 이커머스 제품 광고, 브랜드 캠페인 영상, UGC 스타일 광고처럼 시각적 일관성이 핵심인 작업에 효과적이에요.
AI로 광고 영상을 만드는 법
1단계: 이미지 업로드
영상에서 일관되게 유지하고 싶은 요소의 이미지를 업로드합니다. 목적에 따라 이미지 종류가 달라져요.
- 인물 일관성이 목적이라면: 얼굴이 잘 보이는 인물 사진. AI가 얼굴 구조, 헤어스타일, 의상, 전반적인 분위기를 기준으로 삼습니다.
- 제품 일관성이 목적이라면: 형태와 색상이 명확하게 나온 제품 사진. 이커머스 광고나 데모 영상에서 제품의 디자인 디테일을 유지하는 데 효과적입니다.
- 스타일 일관성이 목적이라면: 원하는 시각적 톤을 담은 스타일 레퍼런스 이미지. 시네마틱, 애니메이션, 럭셔리, 에디토리얼 등 특정 분위기를 영상 전체에 입힐 수 있습니다.
이미지는 배경이 깔끔하고 주요 피사체가 명확하게 보이는 것을 사용하는 편이 좋아요. 흐리거나 복잡한 이미지는 AI가 핵심 요소를 제대로 인식하지 못할 수 있습니다.
2단계: 상세한 프롬프트 작성
원하는 영상을 구체적으로 설명하는 프롬프트를 입력합니다. 레퍼런스 이미지가 "무엇을 유지할지"를 알려준다면, 프롬프트는 "어떤 장면을 만들지"를 알려주는 역할이에요. 더 구체적으로 작성할수록 결과물이 정확해집니다.
프롬프트에 포함하면 좋은 요소:
- 영상 비율 (예: 9:16, 16:9)
- 촬영 스타일 (UGC, 브이로그, 제품 리뷰, 튜토리얼 등)
- 배경 및 장소
- 인물의 외형과 의상
- 카메라 앵글과 움직임
- 장면별 액션과 대사
- 조명과 분위기
- 오디오 및 효과음
- 제외할 요소(텍스트, 워터마크, 왜곡 등)
예시:
"9:16 UGC 스타일 광고 영상. 밝은 자연광이 들어오는 현대적인 거실. 여성 크리에이터가 제품을 들고 카메라를 향해 미소 짓는다. 클로즈업으로 제품을 보여준 뒤 직접 사용하는 모습을 촬영한다. 자연스러운 음성, 부드러운 카메라 움직임, 텍스트와 워터마크 없음."
3단계: AI 광고 영상 생성
'생성하기' 버튼을 클릭하면 AI가 이미지와 프롬프트를 기반으로 광고 영상을 자동으로 제작합니다. 결과가 마음에 들지 않는다면 프롬프트를 수정하여 다양한 버전의 광고 영상을 생성할 수 있습니다.

실제 생성 AI 광고 예시
예시 1: UGC 스킨케어 튜토리얼 영상
📷 참고 이미지
![]() |
![]() |
🧠 전체 프롬프트
밝은 일본식 욕실에서 스마트폰으로 촬영한 15초 분량의 세로형(9:16) UGC 스타일 세럼 스킨케어 튜토리얼 영상. 반투명 창문으로 들어오는 부드러운 자연광, 따뜻한 베이지 톤과 밝은 원목 인테리어, 깔끔한 세라믹 세면대, 미니멀한 일본식 감성이 느껴지는 공간. 핸드헬드 특유의 미세한 흔들림, 진정성 있는 뷰티 크리에이터 분위기, 자연스러운 피부 결, 차분하고 산뜻한 셀프 케어 무드.
촬영에 사용된 휴대폰, 카메라 또는 촬영 장비가 거울에 비쳐서는 안 됩니다. 거울이 등장하는 경우에도 인물의 얼굴과 욕실 공간만 자연스럽게 반사되어야 합니다.
참고 구조:
@image1은 핑크색 세럼 제품입니다.
@image2는 메인 여성 인물(캐릭터) 레퍼런스입니다.
0~2초 — 시선 끌기(Hook)
부드러운 아침 햇살 아래, 촉촉하고 건강해 보이는 피부의 @image2가 카메라 쪽으로 살짝 다가오는 극근접 클로즈업. @image1을 볼 옆에 들어 보이며 자연스럽게 카메라를 향해 말한다. 입 모양과 음성이 정확하게 싱크된다.
대사:
“세럼을 어떻게 발라야 하는지 아직 잘 모르겠다면… 계속 보세요. 제가 평소에 하는 방법을 그대로 보여드릴게요.”
2~4초
@image2가 흰색 스포이드 캡을 돌려 열고 스포이드를 부드럽게 눌러 세럼을 담는 클로즈업. 연한 핑크색 세럼이 자연스럽게 스포이드에 채워진다. 카메라를 향해 약 세 방울 정도를 보여준다.
대사:
“저는 보통 세 방울 정도만 사용해요.”
4~7초
스킨케어 도포 장면의 타이트 클로즈업. @image2가 먼저 양 볼과 이마에 세럼을 떨어뜨린 뒤, 문지르지 않고 양손으로 가볍게 눌러 흡수시킨다.
대사:
“저는 항상 토너 다음, 크림 바르기 전에 사용해요.”
7~10초
욕실 거울 근처의 미디엄 클로즈업. @image2가 남은 세럼을 가볍게 두드려 흡수시키며 창가 쪽으로 살짝 몸을 돌린다. 피부는 자연스럽게 촉촉하고 생기 있어 보인다.
대사:
“이렇게 눌러주면 더 고르게 흡수되는 느낌이에요.”
10~12초
마지막 클로즈업. @image2가 세면대 옆에서 @image1을 얼굴 가까이 들어 보이며 부드럽게 미소 짓는다. 자연광이 피부의 은은한 윤기를 아름답게 비춘다.
대사:
“흡수되고 나면 정말 가볍고 산뜻해요.”
오디오
자연스러운 본인 음성과 은은한 욕실 주변 소리만 포함.
배경 음악 없음.
내레이션 없음.
효과음 없음.
네거티브 프롬프트
텍스트, 자막, 워터마크, 과도하게 빛나는 피부 표현, 번들거리는 유분감, 공중에 떠다니는 세럼 방울, 손가락 왜곡, 손가락 개수 오류, 스포이드 형태 오류, 비현실적인 반사 표현, 강한 스튜디오 조명, 과도한 뷰티 필터, AI 얼굴 왜곡, 부자연스럽거나 지저분한 스킨케어 도포 장면.
🎬 생성 결과
예시 2: 패션 스타일 변환 UGC 영상
📷 참고 이미지
![]() |
![]() |
🧠 전체 프롬프트
9:16, 24fps, 15초.
0~3초:
브이로그 스타일의 전면 카메라 시점. 밝고 아늑한 현대식 아파트가 배경으로 보인다. @image1의 주근깨가 있는 여성은 심플한 흰색 탱크톱과 회색 반바지를 입고 있으며, 한 손으로 옷걸이를 들고 있다. 옷걸이에는 @image2의 스타일링인 버건디 원숄더 탑과 데님 미니스커트가 걸려 있다. 그녀는 활기찬 표정으로 카메라를 보며 말한다.
대사:
“오케이, 이 룩은 꼭 입어봐야겠더라고요. 한번 보세요.”
4~9초:
깔끔한 점프 컷으로 즉시 의상이 전환된다. 그녀는 이제 @image2의 전체 스타일링(버건디 원숄더 탑, 메탈 허리 체인이 달린 데님 미니스커트, 버건디 에나멜 니하이 부츠)을 착용하고 있다. 한 걸음 뒤로 물러서자 카메라가 자연스럽게 아래로 기울어지며 부츠의 광택을 보여준다. 이후 양손을 허리에 올리고 몸을 살짝 움직여 메탈 체인 디테일을 강조한다.
대사:
“잠깐, 이 핏 왜 이렇게 완벽한 거죠?”
10~15초:
그녀가 카메라 쪽으로 걸어오며 미디엄 클로즈업으로 전환된다. @image2의 빨간색 얇은 프레임 안경을 자연스럽게 착용하고 버건디 숄더백을 들어 보이며, 탑의 가죽 질감과 자연스러운 주름을 강조한다. 안경을 살짝 고쳐 쓰고 Y2K 감성의 자신감 있는 미소를 지으며 말한다.
대사:
“이 빈티지 무드가 진짜 다 했어요.”
SFX:
옷걸이가 움직이는 소리
점프 컷 전환 시 부드러운 "후우쉬(Whoosh)" 효과음
에나멜 부츠가 움직일 때의 은은한 마찰음
제외 요소:
텍스트 없음, 자막 없음, 로고 없음, 워터마크 없음.
🎬 생성 결과
예시 3: UGC 라면 리뷰 영상
📷 참고 이미지
![]() |
![]() |
🧠 전체 프롬프트
세로 9:16 셀카 스타일 UGC 즉석 라면 리뷰, iPhone 전면 및 후면 카메라 혼합 촬영, 작은 미국 아파트 주방의 자연광, 핸드헬드로 촬영된 리얼하고 자연스러운 에너지, 친구에게 “여기서 내가 실제로 뭘 먹는지 보여주는” 캐주얼한 분위기, 실제 피부 톤, 필터 없음.
설정 — 작지만 생활감이 있는 학생 주방, 깔끔하지만 사용감이 느껴지는 공간, 부드러운 창가 자연광. 미국에 있는 한국인 여학생이 편안한 후드티를 입고 있음. 조리대 위에는 갓 끓인 라면 한 냄비(김이 올라오는 중)와 원래 라면 패키지가 함께 놓여 있음.
액션 및 대사 시퀀스:
전면 카메라 — 그녀가 라면 패키지를 렌즈 가까이 들고 살짝 미소:
“여기 있을 때는 이거 진짜 자주 먹어요.”
후면 카메라로 전환 — 휴대폰은 조리대에 놓여 있음. 미디엄 샷. 그녀가 라면을 젓고 면을 들어 올리며, 가까이 다가가 냄새를 맡음:
“피곤하거나 바쁠 때는 그냥 이걸 만들어 먹는데, 항상 집에 있는 느낌이 들어요.”
클로즈업 — 그녀가 면을 들어 올리고 김이 올라오는 장면, 한 입 먹고 살짝 고개를 끄덕임:
“음~ 면은 정말 쫄깃하고 국물도 너무 맵지 않고 딱 좋아요.”
마지막 전면 카메라 — 그녀가 그릇을 얼굴 가까이 들고 편안하게 미소:
“혹시 몰라서 집에 항상 몇 개씩은 쟁여 둬요.”
🎬 생성 결과
필요하면 여기서 끝내지 말고 사진으로 동영상 만들기, AI 영상 만들기, 활용 사례도 같이 보면서 어떤 스타일이 더 맞는지 참고할 수 있어요.
자주 묻는 질문
AI 광고 생성기는 무료로 사용할 수 있나요?
일부 기능은 무료로 시작할 수 있어요. 다만 최신 조건은 바뀔 수 있으니 Pollo AI 요금 페이지에서 확인하는 편이 가장 정확합니다.
실제 촬영 없이도 광고 영상이 가능한가요?
가능해요. 제품 사진만 있어도 초안은 충분히 만들 수 있습니다. 다만 손동작이나 사용 장면이 꼭 필요한 상품이라면 나중에 실제 촬영 컷을 조금 섞는 편이 더 자연스러울 수 있어요.
광고 영상 제작 시간을 얼마나 줄일 수 있나요?
사진과 설명이 이미 정리돼 있다면 첫 초안까지 가는 시간은 꽤 많이 줄어들어요. 결국 시간을 제일 많이 잡아먹는 건 생성보다, 처음부터 너무 복잡하게 생각하는 경우가 많습니다.
마치며
AI 광고 영상 제작에서 가장 어려운 부분은 도구를 찾는 게 아니라, 만든 영상이 브랜드답게 보이도록 일관성을 유지하는 것이에요. 레퍼런스 이미지를 제대로 활용하면 이 문제를 처음부터 구조적으로 해결할 수 있습니다.
Pollo AI의 Reference to Video는 제품 사진 한 장, 또는 인물 사진 한 장에서 시작해 브랜드 톤이 살아있는 광고 영상을 바로 만들어볼 수 있어요. 복잡한 설정 없이 지금 바로 시작해 보세요.





