크게 크게 작게 작게
페이스북 트윗터
(시론)AI가 만드는 값싸고 질 낮은 동영상의 위험
입력 : 2023-07-25 오전 6:00:00
생성형 인공지능의 등장으로 영상 제작의 진입 장벽이 크게 낮아졌다. 프리미어나 파이널컷 같은 수백 만 원어치의 편집 프로그램이 필요 없고 복잡한 편집 기술을 전혀 몰라도 된다. 폰트나 저작권도 크게 신경 쓸 필요 없다. 자막도 자동으로 뽑아주고 텍스트만 집어 넣으면 관련 클립 영상도 자동으로 갖다 붙여준다. 심지어 인공지능이 내레이션도 입혀준다. 유튜브를 뒤져 보면 AI로 ‘20분 만에 동영상 뚝딱 만들기’ 같은 속성 강좌가 넘쳐난다. 
 
픽토리나 루멘5, 콜로시안, 인비디오 같은 영상 제작 툴을 쓰면 몇 년 전 서너 명이 며칠 동안 했을 작업을 클릭 몇 번으로 끝낼 수 있다. 챗GPT에게 소설을 요약해 달라고 하고 그 텍스트를 그대로 긁어다 동영상 제작 툴에 집어넣으면 몇 분만에 영상이 튀어나온다. 한국에서도 브류나 비디오스튜, 망고보드 같은 한국어를 지원하는 툴이 늘어나고 있다. 벌써부터 유튜브에는 딱 봐도 인공지능이 찍어낸 듯한 영상이 쏟아지고 있다. 
 
문제는 영상의 퀄리티다. 언뜻 그럴 듯하고 때깔도 좋아 보이지만 조금만 들여다 보면 텍스트와 영상의 맥락이 전혀 맞지 않는 경우가 대부분이다. 이유는 첫째, 저작권이 풀린 클립 영상이 절대적으로 부족하기 때문이고, 둘째, 단순히 키워드를 매칭하는 걸 넘어 맥락을 분석하고 톤 앤 매너를 맞추기에는 아직까지 인공지능의 역량이 크게 떨어지기 때문이다. ‘노가다’를 줄여줄 수는 있지만 편집자의 판단을 대체할 정도의 기술력은 아니라는 이야기다. 
 
비디오스튜의 창업자 우혁준을 만나 물어봤다. 이 ‘불쾌한 골짜기(uncanny valley)’를 해결할 수는 없나. 우혁준은 “당분간 인공지능이 사람 편집자를 완전히 대체하긴 어려울 것 같다”면서 “핵심은 휴먼 터치라고 본다”고 말했다. 상당 부분 자동화하더라도 마지막 단계에서는 사람의 손이 필요하고 그 작은 차이가 퀄리티를 결정할 거라는 이야기다. 비디오스튜는 사람 편집자가 ‘노가다’를 최소화하는 데 서비스 역량을 집중했다. 
 
인공지능 내레이션은 여전히 어색하고 맥락을 끊기도 하지만 꾸준히 개선되고 있고 빠른 속도로 사람을 대체할 가능성이 크다. 스톡 영상의 한계도 투자가 늘어나면서 자연스럽게 해결될 수 있을 거라는 이야기다. 렌더링 속도도 웬만한 개인 컴퓨터보다 서버에서 돌리는 게 훨씬 더 빠르다. 자동 생성 영상의 대부분이 쓰레기에 가깝지만 가까운 미래에 인공지능의 도움 없이 동영상을 만드는 건 무모한 일이 될 것이다. 
 
문제는 진입 장벽이 낮아진 만큼 퀄리티를 높이는 데 투자할 여력이 줄어든다는 데 있다. 정보기술 전문 신문 와이어드는 “광고 캠페인과 마케팅 효율성을 통해 강도를 더해가는 왜곡되고 비뚤어진 비주얼은 현재가 곧 미래라는 사실을 상기시킨다”면서 “현실과 비현실의 끊임없고 격렬한 붕괴, 고정 관념의 리믹싱이 허용될 뿐만 아니라 큰 비즈니스가 되는 통제할 수 없는 현실을 맞닥뜨리고 있다”고 지적했다.
 
2026년이면 인터넷 콘텐츠의 대부분이 합성적으로 생성될 것이라는 전망도 나왔다. 인공지능이 생성한 콘텐츠를 인공지능이 학습하면서 편견과 편향을 확대재생산할 거라는 경고도 나온다. 가까운 미래에 인공지능이 ‘불쾌한 골짜기’를 넘어서겠지만 진실과 환상, 진짜와 가짜의 경계가 무너지면서 휴먼 터치의 영역, 통찰과 판단, 공유의 가치가 더욱 부각될 것이다. 
 
이정환 슬로우뉴스 대표 
 
권순욱 기자


- 경제전문 멀티미디어 뉴스통신 뉴스토마토

관련 기사