[AI 테크 리포트] 차세대 크리에이티브 스튜디오: 구글 플로우(Google Flow)와 제미나이 옴니의 혁신, 20260520(수)
#[AI 테크 리포트] 차세대 크리에이티브 스튜디오: 구글 플로우(Google Flow)와 제미나이 옴니의 혁신, 20260520(수) 최근 구글은 가벼운 아이디어를 한 편의 시네마틱 영상 콘텐츠로 전환해 주는 AI 기반 크리에이티브 스튜디오, ‘구글 플로우(Google Flow)’의 시연 영상을 공개했습니다. 구글 플로우 에이전트(Google Flow Agent)와 제미나이 옴니(Gemini Omni) 모델을 기반으로 작동하는 이 생태계는, 대화형 미디어 프로덕션의 미래가 어떤 모습인지를 명확히 보여주고 있습니다. 영상에 나타난 핵심 워크플로우와 주요 기능들을 전문가의 시각에서 분석해 정리했습니다. ### Phase 1: 인터랙티브 아이디에이션 및 스토리텔링 영상 제작 파이프라인의 시작은 복잡한 프롬프트 입력이 아닌, 일상적인 대화에서 출발합니다. 사용자가 키우는 반려물고기 '베타(Betta fish)'를 기반으로 한 스토리 아이디어를 요청하는 방식입니다. * 공동 크리에이터로서의 에이전트: 구글 플로우 에이전트는 요청을 받자마자 위대한 탈출(The Great Escape), 성 안의 포탈(The Portal in the Castle) 등 다채로운 내러티브 플롯을 즉각적으로 생성하며, 단순한 개념을 구조화된 판타지 스토리로 발전시킵니다. ### Phase 2: 시각적 미학 및 스타일 큐레이션 스토리라인이 확정되면, 플랫폼은 프로젝트의 시각적 언어(Visual Language)를 정의하는 과정을 지원합니다. *예술적 스타일 추천: 사용자가 적절한 키워드를 고민할 필요 없이, 에이전트가 마법 같은 리얼리즘(Magical Realism), 몽환적인 느낌(Ethereal Dream)부터 초현실적인 자수 스타일(Cross-stitch Surrealism) 같은 독창적인 텍스처까지 최적의 비주얼 스타일들을 먼저 제안합니다. ### Phase 3: 자연스러운 에셋 통합 (@-멘션 기능) 이번 시연에서 가장 강력한 UX 혁신으로 꼽히는 부분은, 대화형 명령...