얼마 전 헐리우드의 아카데미 시상식이 끝난 후, 몇 년 전에 화제가 되었던 통계 하나가 다시 온라인에 돌아다녔다. 1991년부터 25년 동안 아카데미 최우수 작품상을 받은 영화 25편을 분석해서 출연한 남자 배우들과 여자 배우들의 대사량(단어 수)을 비교한 통계다. 극 중 비중이 있는 인물을 중심으로 비교하기 위해 100단어 이상 말한 배우들로 한정했다.

표를 보면 여자 배우들의 대사가 더 많은 영화는 2003년 작 '시카고(Chicago)' 밖에 없다. 더 눈에 띄는 건 남자들의 대사가 약간 많은 게 아니라, 압도적으로 많다는 사실이다. '허트 로커(Hurt Locker, 2008)'의 경우는 남자들만 모인 군부대의 이야기라서 그렇다고 할 수 있어도 (감독은 이 영화로 여성 최초로 감독상을 받은 캐서린 비글로우다) '쉰들러 리스트(Schindler's List, 1994)'도 남자들만 말해야 하는 영화였을까?

(출처: BBC)

하지만 진짜 놀라운 건 어쩌면 우리가 이런 영화들을 봤음에도 이 표를 보고 놀랐다는 사실일지 모른다. 남자들의 대사가 더 많다는 건 알고 있었지만, 이 정도로 큰 차이가 날 줄은 몰랐다면 우리가 남자들이 더 많은 말을 하는 상황을 자연스럽게 받아들이고 있다는 얘기다. 이런 상황에서는 사람들은 여자가 조금만 말을 길게 해도 말이 많다고 느끼고, 여자에게 약간의 발언권만 허용하고도 평등한 발언권을 갖고 있다는 착각을 하게 된다.

위의 표가 실린 BBC의 기사는 '벡델 테스트(Bechdel test)'를 이야기한다. 미국의 만화가 앨리슨 벡델(Alison Bechdel)이 영화의 성평등 정도를 측정하기 위해 1985년에 만들어낸 이 유명한 테스트를 통과하는 방법은 아주 간단하다. 1. 영화에 이름을 가진 여성이 둘 이상 등장하고 2. 여성들이 서로 이야기하는데 3. 여성들이 나누는 이야기의 주제가 남자에 관한 내용이 아니면 통과다. 그런데 이 기사가 나온 2018년을 기준으로 아카데미 최우수 작품상을 받은 영화의 51%가 이 간단한 테스트를 통과하지 못했다. 특히 1970년대가 심각해서 20% 밖에 통과하지 못했고, 1990년대는 나아져서 70%가 통과할 수 있었다.

최신 영화의 벡델 테스트 결과를 꾸준히 업데이트하는 웹사이트도 있다. (작년에 나온 '아바타: 물의 길'은 통과하지 못했다.)

1970년대와 1990년대 아카데미 최우수 작품상 수상작들의 벡델 테스트 결과 비교 (이미지 출처: BBC)

이 BBC 기사는 푸딩(The Pudding)이라는 웹사이트를 인용하고 있다. (참고로, "롱폼 데이터 저널리즘"을 표방하는 푸딩은 각종 데이터의 시각화는 물론이고, 다양한 미디어를 사용해서 우리가 사는 세상을 설명해준다. 사이트 광고가 아니라 내용에 감탄해서 하는 추천이니 한번 들러보시길 권한다.) 푸딩에서 2016년에 헐리우드의 영화들을 젠더와 나이를 기준으로 분석한 기사가 있다. 2,000개의 영화 대본들을 살펴본 결과다. 길지 않은 내용이니 우리말로 옮겨보면 아래와 같다. 원문은 여기에서 읽을 수 있다.


최근 (이 글은 2016년에 나왔다–옮긴이) 헐리우드에 성차별과 인종차별이 만연하다는 비판이 쏟아진다. 이런 비판에 공통적으로 등장하는 것은 '백인 남성들이 압도적으로 많은 배역을 차지하고 있다'라는 것이다.

하지만 이건 주장일 뿐 이를 뒷받침하는 데이터가 없었고, 이런 식으로는 정보에 입각한 논의를 할 수 없다. 정확하게 얼마나 많은 영화들이 남자들의 이야기이고, 이는 장르와 시대, 극장 수입 등에 따라 어떻게 달라지고, 어떤 환경에 다양성이 증가할까?

우리는 특정 주장을 증명하기 위해 분석을 시작하지 않았다. 제대로 된 데이터(real data)를 모으려는 의도였기 때문에 이를 '연구'가 아닌 '센서스'로 취급했다. 구글을 통해 8,000개의 영화 대본을 찾아서 각 캐릭터의 대사를 배우와 연결했다. 그렇게 해서 약 2,000개의 영화 속 남성과 여성 캐릭터가 말한 대사 속 단어 수를 추출했다. 사상 최대의 영화 대본 분석 작업이었다고 할 수 있다.

자, 그럼 디즈니가 만든 작품들에 나오는 대화를 젠더별로 구분해보자.

영화 속 남성(파란색)과 여성(빨간색)의 대화량 비교. 왼쪽은 남성이 대사의 60% 이상을 차지하는 영화들, 오른쪽은 여성의 대화가 더 많은 영화들, 가운데는 대체로 균등하게 나눠진 영화들이다. (출처: The Pudding)

'뮬란'은 여성 캐릭터가 리드하는 주제와 달리 여성의 대사는 1/4에 불과하다.

2016년 1월, 디즈니가 만든 '공주 영화들' 중에서도 남자 캐릭터가 여자 캐릭터보다 더 많은 말을 한다는 연구 결과가 나왔다. 우리는 이 결과가 사실임을 확인할 수 있었다. 우리는 더 나아가 표본 크기를 (디즈니가 인수한) 픽사를 포함하는 30개로 늘려봤고, 그 결과는 그중에서 22개가 남성이 대다수의 대사를 차지하는 영화들이었다. 심지어 '뮬란(Mulan, 1998)'처럼 여자 캐릭터가 주인공인 작품에서도 남자 캐릭터의 대사가 더 많았다. 뮬란을 보호하는 역할을 하는 작은 용인 무슈(Mushu, 에디 머피의 목소리)는  뮬란보다 50% 더 많은 말을 했다.

'니모를 찾아서'에서 여성 캐릭터인 도리의 말을 많이 기억하지만, 대사의 3/4은 남성 캐릭터에게 돌아갔다.

여자 주인공의 이름이 제목인 '포카혼타스'의 경우도 여성 캐릭터의 대사량은 1/3에 불과하다.

'인사이드 아웃'은 드물게 여성 캐릭터의 목소리가 압도적인 작품이다.

이 데이터 세트는 완벽하지 않다. 뮬란의 경우 주인공 뮬란이 직접 말을 하지 않아도 영화의 플롯은 뮬란을 중심으로 진행된다. 우리가 모은 데이터는 전적으로 영화 대본에 의존했기 때문에 영화를 완벽하게 대변한다고 보기는 힘들다.

사용한 방법론

우리는 대본별로 최소 100단어 이상을 말하는 등장인물을 추출해서 IMDb에 있는 인물의 페이지(남자 배우, 혹은 여자 배우로 구분하고 있다)와 매칭을 했다. 이렇게 한 이유는 작은 배역의 경우 IMDb에 제대로 표시되지 않기 때문이다. 하지만 이런 방식 때문에 뜻하지 않은 결과도 생긴다. 가령 '쉰들러 리스트'에는 대사를 말하는 여성 캐릭터들이 있지만 100단어를 넘지 못해서 포함되지 않았다. 따라서 '쉰들러 리스트' 속 대사에서 남자 배역이 차지하는 비중은 (맨 위의 표에서 보는 것처럼) 100%가 아니라 99.5%가 되는 게 맞다.

또 다른 문제도 있다. 영화는 실제로 촬영하면서 대본과 꽤 달라진다. 감독들은 대사를 쳐내기도 하고 캐릭터를 없애기도 한다. 때로는 없던 캐릭터를 추가하기도 하고, 이름을 바꾸기도 한다. 심지어 캐릭터의 젠더를 바꾸기도 한다. 따라서 우리가 발견한 내용은 전반적으로 맞지만, 개별 영화를 살펴보면 오류가 있을 수 있다.

각 대본은 적어도 90%의 대사가 성별에 따라 구분되어 있다. 분석에서 빠진 캐릭터를 발견했다면 나머지 10%에 속하는 캐릭터였을 것이다. 만약 특정 캐릭터가 대본에는 등장했는데 실제 영화에서는 빠졌을 경우, 우리는 그 캐릭터의 젠더를 대본 속 (she, he와 같은) 대명사를 바탕으로 추론했다.

우리가 모은 데이터 세트에 포함된 수천 편의 영화 중에서 남성 캐릭터에 더 많은 대사가 주어지지 않은 예를 찾기는 쉽지 않았다. 심지어 로맨틱 코미디에 나오는 대사들만 봐도 남성 캐릭터의 대사가 평균 58%를 차지한다. 예를 들어 '프리티 우먼(Pretty Woman, 1999),' '내가 널 사랑할 수 없는 10가지 이유 (10 Things I Hate About You , 1999)'처럼 여성 주연이 끌고 가는 영화, 달리 말해 여성 주연에게 가장 많은 대사가 주어지는 영화의 경우에도 다른 배우들을 합해보면 남성 캐릭터들의 대사가 52%에 달했다. 조연에 남자들이 많기 때문이다.

여성이 리드하는 대본은 얼마나 될까?

가장 많은 대사가 여성 캐릭터에게 주어진, 여성이 리드하는 영화는 전체의 22%에 불과했다. 여성 캐릭터는 영화를 리드하기보다는 중요도에서 두 번째를 차지할 가능성이 더 높았다. 34%가 그런 영화였다. 가장 처참한 통계는 영화에서 가장 중요한 역할을 차지하는 3명 중에서 최소 2명이 여성 캐릭터일 가능성으로, 단 18%에 불과했다. 남성의 경우 82%였다.

나이 든 남자 배우 vs. 나이 든 여자 배우

각 영화의 개봉 시점에서 출연 배우들의 나이를 확인해봤다. 이를 통해 헐리우드에 정말로 젊은 여자 배우들을 선호하는 편견이 있는지, 혹은 그 반대로 남자 배우들이 나이가 들어서도 연기를 오래 하는 것인지 수치를 통해 확인할 수 있었다.

나이에 따른 대사의 양은 남성과 여성이 완전히 반대였다. 40세가 넘은 여자 배우에게 주어지는 대사의 양은 크게 줄어들었지만 남자 배우의 경우는 더 많은 대사가 나이 든 남자에게 주어졌다.

나이에 따라 주어지는 대사의 양. 여성(왼쪽)과 남성(오른쪽) 비교.

이를 다른 그래프로 보면 아래와 같다:

이 프로젝트를 진행한 이유

우리가 프로젝트를 해보기로 한 이유는 먼저 발행한 기사 때문이었다. 그 기사에서 우리는 벡델 테스트를 통과하지 못한 영화들을 분석했는데, 이를 읽은 사람들의 반응이 그다지 좋지 않았다. 어떤 이들은 댓글을 통해 벡델 테스트 자체에 문제가 있으며, 영화들이 흥행에 실패하는 데는 그럴 만한 이유가 있다고 주장했다. 우리는 대사의 양을 측정함으로써 영화 속 젠더를 더 객관적으로 볼 수 있었다.

많은 독자가 일부의 사례를 보면 분명해 보이는 결론을 내리지만, 데이터를 수집하는 힘든 작업을 하는 사람들은 없었다. 영화 대본을 IMDb와 대조하는 작업에만 몇 주가 걸렸다. 그렇게 얻어진 결과는 완벽하지는 않아도 최소한 "여자가 40이 넘으면 매력이 없으니까 그런 거 아니겠어"라는 식의 주장보다는 나은 근거를 갖게 되었다.  

우리가 사용한 자료들은 모두 전부 이 구글 문서에서 확인할 수 있고, 우리가 (소송을 당하지 않는 선에서) 공유할 수 있는 데이터는 깃허브에 모아 두었다. 우리가 사용한 데이터와 방법론에 관해 자주 받는 질문과 답은 여기에서 볼 수 있다.

만약 코딩에 익숙하지 않은 독자라면 아래에서 각 작품과 장르, 연도 등의 조건을 바꿔가며 확인할 수 있다.

기사에서 제공한 코드 임베드에 문제가 있기 때문에 기사로 직접 가서 글 맨 아래에 있는 다음과 같은 차트를 찾아 직접 확인하시기 바란다.