[Journal] 유튜브 영상 분석은 논쟁의 여지없이 Gemini
- Soomin Kim
- Jun 30
- 3 min read
AI 툴을 현업에 적용하는 마이크로 테스팅을 진행하면서, 특정 작업에서는 논쟁의 여지 없이 확실한 '정답'이 존재한다는 것을 발견한다. 유튜브 영상을 분석하는 작업이 바로 그렇다.

결론부터 말하면, 유튜브 영상을 제대로 분석하고 싶다면 선택지는 하나다.
Google AI Studio의 워크벤치 위에서 Gemini 2.5 Pro 모델을 사용하는 것.
이것은 단순한 추천이 아니라, 워크플로우의 효율성과 분석의 깊이에서
다른 모든 대안을 압도하는 유일한 방법이다.
더 자세히 들어가기 전, 나포함 많은 이들이 헷갈려 하는
Google의 AI 포트폴리오를 먼저 정리하고 넘어갈 필요가 있다.
헷갈리는 구글에서 출시한 AI 관련된 포트폴리오 용어 정리
내가 이해하는 Google의 AI 포트폴리오를 실제 '영상 제작 현장'에 비유하면 이렇다.
Google AI Studio (기획/사무실): PD(Gemini)가 레퍼런스를 분석하고 시장 조사를 하며 아이디어를 다듬는, 프리-프로덕션의 핵심 기지.
Gemini (총괄 PD / 메인 연출가): 전체 프로젝트의 맥락을 이해하고 전략을 짜는 핵심 두뇌.
Veo & Imagen (촬영 감독 & VFX 팀): Gemini라는 PD의 지시를 받아 실제 영상(Veo)과 이미지(Imagen)를 '찍어내는' 실행팀.
Flow (메인 편집실 / 종합 프로덕션 스위트): 촬영된 소스를 가지고 컷을 붙이고 최종 결과물을 만드는 통합 소프트웨어. 즉, Veo, Imagen을 운영할 수 있는 소프트웨어이기도 하다. 파이널컷이나 프리미어의 AI 버전을 지향하는 것으로 보인다.
다시 돌아와서, 다른 AI 툴보다 Gemini가 YouTube 분석만큼의 우수성을 띄는 이유는 한가지다.
'Google 생태계'의 힘에 있다.
똑같은 유튜브 영상 링크를 ChatGPT에 넣으면,
<현재 YouTube 영상 페이지에 접근할 수 없어 분석하지 못하고 있어요>라는 메시지를 받게 된다.

ChatGPT와 같은 외부 툴은 유튜브의 데이터에 직접 접근할 권한이 없기 때문이다.
하지만 Gemini는 같은 Google 소속이기에, 유튜브 링크를 입력하는 것만으로 영상의 모든 데이터 레이어에 접근할 수 있다. 이는 단순히 CC(자막) 텍스트를 긁어오는 수준이 아니다. 영상의 시각적 요소, 사운드, 설명란, 심지어 태그된 제품 정보까지 한 번에 빨아들여 종합적으로 분석한다.
실전 테스트: 유튜브 분석 <링크 붙여넣기>

나는 이 기능을 직접 테스트해보기 위해, SBS 뉴스 '오목교 전자상가'의 '죽은 인터넷 이론'편 링크를 넣었다. 그리고 "이 영상의 핵심 내용, 타겟 오디언스, 예상 수익 모델을 종합적으로 분석해달라"고 요청했다.
결과는 놀라웠다.
Gemini는 단순히 내용을 요약하는 데 그치지 않고,
'음모론 제시(도입) -> 구체적 사례(현실화) -> 학술적 근거(심화) -> 철학적 질문(결론)'으로
이어지는 영상의 정교한 스토리텔링 구조를 완벽하게 해체했다.
나아가 '20-40대 디지털 네이티브'라는 타겟 오디언스의 특징을 명확히 규정하고, 이를 바탕으로 '유튜브 광고 수익'을 넘어 '브랜디드 콘텐츠', 'SBS 브랜드 이미지 제고'까지 가능한 다각적인 수익 모델을 제시했다.
단순한 추측이 아니라, 유튜브와 구글이 가진 데이터를 바탕으로 나온 리포트라는 점에서 신뢰가 갔다.
가장 소름 돋았던 것은 영상마다 분석해주는 어투가 해당 영상의 톤을 따라가고, 마치 채널의 비공개 유튜브 스튜디오 데이터를 직접 들여다본 것처럼 '시청자 유지율'과 '평균 시청 지속 시간' 같은 핵심 지표를 기반으로 성공 요인을 해체했다.
그러나 제작은? Google이 해결할 수 있을까?
분석 툴로서의 Gemini는 이처럼 강력하지만, 실제 제작 툴로 넘어가면 이야기는 달라진다.
내가 정말 테스트하고 싶었던 것은 영상 제작 툴인 Flow와 그 안의 Veo였다. 다음 포스트에서 더 자세히 하겠지만 간략하게 말하면 다음과 같다.

Flow의 인터페이스를 처음 봤을 때, 이것이 파이널컷이나 프리미어를 대체하려는 구글의 야심이라는 것을 직감했다. 프로젝트 단위로 작업물을 관리하고, 씬 빌더를 통해 시퀀스를 만드는 방식은 명백히 전문 편집 툴을 지향하고 있었다.
하지만 딱 거기까지였다.
가장 아쉬운 점은 '오디오'를 전혀 따로 제어할 수 없다는 점이다. PD로서 영상과 사운드는 떼려야 뗄 수 없는 관계다. 영상 퀄리티에 맞는 섬세한 사운드 디자인을 하고 싶어도, Veo가 프롬프트에 맞춰 생성해준 오디오를 뜯어보거나 수정할 방법이 없다.
또한, Veo가 한 번에 소화할 수 있는 데이터의 양은 한정적이라 복잡한 연출을 요구하면 결과물이 깨진다. 그렇다면 차라리 비주얼 따로, 오디오 따로, 이펙트 따로 작업해서 합치고 싶은데, Flow는 그런 모듈(Module)식 접근을 전혀 허용하지 않는 '닫힌 상자'와 같다.
이것이 현재 AI 영상 제작 툴이 가진 가장 큰 한계다.
결론적으로, Google AI Studio와 Gemini는 분석 단계에서만큼은 강력한 조연출, 혹은 파트너 작가의 역할을 할 수 있다. 하지만 실제 제작 툴인 Flow는 '통합'을 지향하면서도 정작 PD에게 가장 필요한 '디테일 컨트롤'의 자유를 주지 않는다는 점, 뜯어서 수정은 불가하다는 점에서 아직 성장할 방향성이 남아있음을 느꼈다.
Comments