중국에서 생성형 AI 도구는 엔터테인먼트의 특징과 실용성을 결합해 독특한 틈새시장을 개척하는 동시에 문화유산 보존에 중요한 역할을 하고 있다.
그중 베이징 소재 한 AI 스타트업이 지난주 이미지를 비디오로 생성하는 파운데이션 모델 비두(Vidu)-1.5를 출시해 눈길을 끌었다. 이는 각 엔터티(entity) 간 일관성을 지원하는 멀티모달 모델이다.
비두-1.5는 세 개의 이미지만 입력해도 AI가 하나의 동영상을 생성해 준다. 예를 들어 회사에서 공유한 동영상에 '한 남자, 미래형 메카슈트, 북적거리는 도시 야경'이라는 이미지를 입력하자 단 30초 만에 일관성을 유지한 하나의 몽타주로 완벽하게 어우러진 영상이 만들어졌다.
사실상 인물, 복장, 환경 등 여러 엔터티를 이해하고 제어하는 것은 AI 비디오 생성 기술의 최대 과제로 꼽혔다.
앞서 챗(Chat)GPT가 소라(Sora)를 출시해 시장을 선도하자 중국 테크기업도 발 빠르게 경쟁 대열에 뛰어들어 자신들만의 독특한 제품을 잇따라 출시했다. 성수(生数)테크의 비두가 대표적인 예다.
생성형 인공지능 콘텐츠(AIGC) 도구인 비두는 이미 전 세계 크리에이터들 사이에서 창작 열정을 불러일으켰다. 이들은 비두를 활용해 런웨이에서 오트 쿠튀르를 선보이는 레오나르도 디카프리오, 화려한 중국 재킷을 입고 전기 스쿠터를 타고 달리는 일론 머스크, 또는 일본 애니메이션 장면 등 장난스럽고 상상력이 넘치는 클립을 만들어 냈다.
탕자위(唐家渝) 성수테크 최고경영자(CEO)는 신화통신과의 서면 인터뷰에서 비두는 하나의 장면에서 멀티 유저가 지정한 객체(object) 간에 논리적 관계를 설정하는 혁신을 일궈냈다고 소개했다.
기존의 텍스트 투 비디오 툴을 사용해 '크리스털을 배경으로 케이크를 들고 있는 소년'과 같은 장면을 생성하면 블라인드 박스를 여는 것처럼 매번 소년, 케이크, 크리스털의 이미지가 달라진다. 탕 CEO는 이젠 소년, 케이크, 크리스털의 정체성이 동영상 전체에 걸쳐 일관성을 유지하면서 실물과 흡사한 연속성을 유지할 수 있다고 말했다.
탕 CEO 등 중국 기업가는 물론, 막대한 자본을 보유한 글로벌 투자자들이 AIGC 분야에 속속 진입하면서 중국 내 시장 입지를 넓혀가고 있다.
지난 8월 또 다른 인공지능 회사 즈푸(智譜)AI는 비디오 생성 제품 칭잉(清影∙Ying)을 선보였다.
이어 이번 달에는 중국 동영상 플랫폼 선두주자인 콰이서우(快手)가 비디오 생성 파운데이션 모델의 앱(APP) 버전 '커링(可靈)'을 출시했다. 애플과 안드로이드 스토어에 출시된 커링 앱을 이용하면 사용자는 생성한 동영상을 최대 3분까지 늘릴 수 있다.
이처럼 중국 AI 기업들은 혁신을 기반으로 시장 규모를 키워가고 있다.
지난주 포브스 차이나는 50대 혁신 기업 명단을 발표했다. 그중 8개의 파운데이션 모델 기업이 포함돼 높은 비중을 차지했다.
중국 사이버공간관리국이 지난 8월 발표한 통계에 따르면 중국에서 출시된 생성형 AI 제품은 180개 이상이다.
실제로 중국에선 온라인 사용자의 엔터테인먼트 제작을 활성화하는 것 외에 AIGC 툴이 다양한 시나리오에 적용되고 있다. 문화유산 보존과 홍보가 대표적이다.
중국 최초로 고대 중국 문화를 홍보하기 위한 공상과학 단편 드라마 '싼싱두이(三星堆): 미래 계시록' 제작에 틱톡의 모회사인 바이트댄스가 자체 개발한 AI 툴 지멍(激萌∙Faceu)이 사용됐다.
12부작으로 구성된 해당 시리즈에는 AI 스크립트 작성, 콘셉트∙스토리보드 디자인, 이미지 투 비디오 생성, 영상 편집, 미디어 콘텐츠 향상 등 다양한 생성 기술이 도입됐다.
향후 중국 AI 경제 역시 낙관적으로 전망된다.
중국정보통신연구원이 지난 7월에 발표한 '글로벌 디지털 경제 백서(2024년)'에 따르면 전 세계적으로 거대 언어 모델(LLM)은 1천300여 개에 달한다. 그중 중국의 비중은 30% 이상으로 미국에 이어 2위를 차지했다.
글로벌 컨설팅 기업 맥킨지 보고서에서는 생성형 AI가 세계 경제에 7조 달러를 더할 것으로 추산했다. 이 중 중국의 기여도는 이 금액의 약 3분의 1에 해당하는 2조 달러로 예상된다.