이 글의 일부는 중앙일보의 '디지털 세상 읽기'에 게재되었습니다.


온라인 동영상에 붙는 자막은 공공장소에서, 혹은 몰래 보는 영상일 경우 소리를 끈 채 영상을 즐길 수 있게 해 준다. 이런 사용자가 많다는 사실을 발견한 페이스북은 사용자가 영상을 보다 폰의 볼륨을 0으로 줄이면 자동으로 자막이 등장하는 기능을 도입하기도 했다. 하지만 자막 기능의 가장 중요한 사용자는 청각장애인들이다. 이들이 말이 들어간 영상을 즐기기 위해서는 자막이 필수적이다. (그리고 어떤 지적처럼 배우의 발성과 사운드 처리가 좋지 않은 영상에서는 단순히 내용을 이해하는 데도 필수적이다).

문제는 이 자막을 누가 만드느냐다. 가장 좋은 건 영상 제작자, 즉 크리에이터가 만드는 것이지만 시간과 돈이 들어가는 이 작업을 하지 못하는 경우가 많다. 그래서 유튜브는 인공지능을 통한 자동자막 생성 기능을 개발했지만, 아직 부족하다. 특히 정확하지 않은 발음이 많은 일상의 대화나 유행어의 경우에 오류가 많다.

그래서 많이 사용하던 것이 커뮤니티 자막작업 기능이다. 채널의 팬 커뮤니티가 참여해 작업해 주는 방식으로, 기계보다 정확하게 문맥을 파악해 자막을 만든다. 집단지성(+팬들의 자원봉사)을 이용한 작업인 셈이다. 그런데 유튜브는 지난해에 이 '커뮤니티 자막작업 기능'을 없애버렸다. 누구나 자막을 작성할 수 있게 하자 이를 악용해 광고를 하거나 장난을 치는 사람이 많다는 것이 그 이유였다. 청각장애인들이 크게 반발했지만, 기업의 결정이니 어쩔 도리가 없었다.

하지만 그 이후 유튜브의 자막 편집기를 사용해서 직접 자막 작업을 하는 크리에이터가 급증했다고 한다. 자막이 사용자들에게 얼마나 중요한지 확인했기 때문이다. 청각장애인뿐 아니라 주의력 결핍 장애, 학습 장애를 갖고 있는 사람들, 그리고 직장이나 수업 시간에 몰래 영상을 보는 사람들까지 아주 많고 다양한 사람이 자막의 도움을 받고 있다는 사실을 깨달은 거다.

동영상에 들어가는 자막은 크게 개방형(open caption)과 폐쇄형(closed caption)으로 나뉜다. 전자는 따로 자막을 켤 필요 없이 무조건 영상에 포함되어 나오는 형태다. 한국에서 제작한 뉴스에서 인터뷰이가 외국어로 이야기할 때 번역을 해서 화면에 등장하는 경우가 그렇고, 예능 프로그램에서 재미를 더 하기 위해 넣는 경우도 여기에 포함된다. 반면 (흔히 [cc]라는 로고로 표현되는) 폐쇄형 자막의 경우 원하는 사람만 켤 수 있게 하는 기술로, 검은색 박스 안에 등장한다. 둘 다 미국에서 1970년대에 등장한 기술이다.

'슈카월드' 채널의 폐쇄형 자막

한국의 매스미디어는 예능 프로그램에서는 "자막 공해"라는 말이 나올 만큼 무차별적인 (그리고 맞춤법을 무시한) 개방형 자막을 쏟아내면서도 정작 청각장애인을 위한 자막 만들기에 아주 인색하다. 반면 유튜버 중에는 폐쇄형 자막(흔히 [CC]라는  제작에 적극적인 사람들이 많고, 그리고 뉴미디어들의 경우는 아예 개방형 자막을 기본으로 제작하는 곳이 흔하다. 시청자들이 소리를 켤 수 없는 환경에서 보는 경우도 많고, 아예 소리 없이 보는 것에 익숙해진 사람들도 많다는 것을 알기 때문에 그렇게 하는 것이다.

'닷페이스' 채널의 개방형 자막

지하철 승강기는 장애인들을 위해 설치되었지만 지금은 노약자들이 더 많이 사용하고, 큰 짐을 들고 지하철을 탄 사람들도 애용하게 되었다. (물론 그 바람에 휠체어 이용자들이 더 많이 기다려야 하는 경우도 발생하지만, 궁극적으로 우리에게는 더 많은 승강기가 필요할 뿐이다). 장애인을 위해 승강기를 만들자 전에는 몰랐던 수요가 발생하고, 더 많고 다양한 사용자들이 나타나듯, 동영상 자막도 처음에는 장애인을 위해 탄생했지만, 이제는 비장애인들이 더 많이 사용하는 기술이다.

이게 다양성의 힘이다. 우리는 다양성이 가진 힘, 다양한 사회가 발휘할 수 있는 잠재력이 얼마나 큰지 아직 모른다. 지극히 일부만을 겨우 맛보기 시작했을 뿐이다.