전 세계가 주목하는 2024년 미국 대통령 선거가 이제 5일 앞으로 다가왔다. 현재 여론조사에 따르면 공화당 후보 도널드 트럼프와 민주당의 카멀라 해리스는 어떤 예측도 불가능할 정도로 박빙의 경쟁을 하고 있다. 지금 상황에서 누가 이길 것이라고 장담하는 사람이 있다면 자기만의 특별한 예측 방법이 있는 사람이거나, 아니면 그냥 50%의 확률로 베팅하는 것에 지나지 않는다. 여론조사는 어느 쪽도 우세하지 않다고 말하기 때문이다.

이런 상황을 보며 카멀라 해리스를 지지하는 사람들이 분통을 터뜨린다. 한쪽은 민주주의 체제를 인정하는 정상적인 후보이고, 다른 쪽은 "내가 이 선거에 지면 부정 선거"라는 2020년의 주장을 반복하며 "내가 이번에 당선되면 앞으로는 투표를 하지 않아도 되게 하겠다"는 후보인데, 어떻게 그런 두 후보가 민주주의 국가에서 동등한 지지율을 보이고 있느냐는 거다. 어쩌면 단순히 트럼프가 그만큼 인기 있다는 얘기일 수도 있다. 하지만 여론 조사와 분석에 대해서 아는 사람은 그게 그렇게 단순한 문제가 아님을 안다.

잘 알려진 것처럼 트럼프가 처음 등장한 2016년에는 조사 기관과 분석가들은 그때까지 사용해 온 방법을 적용해서 힐러리 클린턴의 승리, 그것도 압승을 예측했지만 거의 모든 기관의 예측이 틀렸다. 두 후보의 당선 가능성이 완벽하게 같다고 해서 실제로 두 사람이 같은 득표를 한다고 장담하는 사람은 없다. 현재의 조사방법론으로는 실제 결과를 정확하게 예측하기 힘들다.

선거 결과 예측은 단순히 질문에 대한 응답을 모아 총계(tally)를 내는 작업이 아니다. 모든 유권자가 전화를 받는 게 아니기 때문에, 특정 집단의 응답 수가 적으면 그걸 바탕으로 추정하는 작업을 해야 한다. 그 집단이 여론 조사에 응답을 적게 했다고 투표율도 떨어진다고 볼 수 없기 때문이다. 또한 특정 후보에 대한 지지율이 높아도 과거 선거에서 전통적으로 투표율이 떨어지는 유권자 집단일 경우, 그 집단의 응답이 100% 선거에 반영된다고 해석하면 안 된다. 응답자에 따라 무게를 다르게 줘야 한다.

미국에서 여론조사는 그 숫자도 늘었고, 방법도 다양해졌다. (이미지 출처: Pew Research Center)

그렇다고 2016년 대선 때 여론조사기관들이 그런 걸 몰랐던 게 아니다. 알고 있었지만, 이전 선거 때와 달리 미디어와 통신 환경이 크게 변했고, 무엇보다 도널드 트럼프라는, 기존의 정치인과는 전혀 다르게 작동하는 인물의 파급 효과를 충분히 고려하지 않았기 때문에 수집된 데이터의 해석이 잘못되었던 거다. 2016년 선거 이후 조사기관들의 큰 반성이 있었고, 예측의 정확도를 높이기 위한 많은 연구가 진행되었다. 그렇다면 4년 후인 2020년 대선에서는 얼마나 정확했을까?

조 바이든 후보가 트럼프를 누른다는 결과는 맞췄지만, 바이든이 꽤 넉넉하게 이길 거라는 조사기관들의 예측보다 훨씬 더 팽팽한 승부였다. 이제 선거 여론조사는 믿지 말아야 한다는 비판론이 일었다. 하지만 그런 비판론은 조사기관들이 더 정교한 분석 방법을 만들어야 한다는 대중의 요구다. 그래서 조사기관과 분석가들은 다시 가중치 조절에 착수했고, 2022년 중간 선거 결과 예측에 변화한 방법이 적용되었다.

그해 여론조사기관들은 "붉은 물결(red wave)," 공화당의 완전한 압승을 예상했다. 미국에서는 집권당이 중간 선거에서 패하는 일이 흔한데, 여론조사를 분석해 보니 민주당은 참패한다는 거였다. 하지만 결과는 달랐다. 공화당은 우세했지만, 예측보다 훨씬 약했고, 중간선거에서 야당(공화당)의 프리미엄을 생각하면, 사실상 민주당의 승리나 다름없었다. 공화당 후보의 득표력을 꾸준히 과소평가했던 여론조사의 예측이 2022년에는 민주당 후보들의 득표력을 과소평가한 셈이다.

그렇다면 다음과 같은 해석이 가능하다. 2016년 "샤이 트럼프 유권자(숨은 트럼프 지지자)"들의 존재에 놀란 여론조사기관들은 조사로 얻은 데이터 중 공화당 지지 응답자에 꾸준히 가중치를 늘려왔다. 그런데 2020년에는 충분하지 못했고, 2022년에는 지나치게 많은 가중치를 부여했다는 거다. 이 주장을 하는 사람이 CNN 해리 앤튼(Harry Enten)이다. 그에 따르면 1972년 이후로 세 번 연속으로 여론조사의 예측을 벗어나 전국 혹은 경합 주에서 승리한 정당은 없다. 2016년과 2020년에 이어 이번 선거에서도 여론조사가 공화당의 득표율을 과소평가한다면 그건 미국 선거 역사에서 전례가 없는 사건이 될 것이라는 게 그의 설명이다. 트럼프가 아무리 전례 없는 대통령 후보라고 해도 말이다.

“Historically unprecedented”: CNN analyst explains why polls may be “underestimating” Kamala Harris
CNN’s Harry Enten thinks pollsters may have over-corrected after getting last two elections wrong.

지지율의 해석

트럼프의 선거운동본부와 해리스의 선거운동본부는 여론 조사를 상당히 다른 태도로 접근한다. 뒤늦게 후보가 된 후로 트럼프를 바짝 추격해 온 해리스는 지지자들에게 자기가 경합주에서 트럼프에 오차범위 내에서 뒤지고 있거나 비기고 있다고 말한다. 사실이기도 하지만, 그런 메시지는 해리스의 승리 전략에 유리하다. "샤이 트럼프" 표에 패했던 2016년 대선을 분석한 민주당은 힐러리 클린턴을 지지하던 유권자 중에서 여론조사를 기반으로 승리를 낙관하고 투표소에 가지 않은 사람이 많았음을 알게 되었다. 그 실수를 반복해서는 안 되는 해리스는 비기거나 뒤지고 있다는 메시지로 유권자들이 긴장을 풀지 않게 할 뿐 아니라, 광고에 사용할 수 있는 기부금을 많이 모을 수 있다. 내가 지지하는 후보가 아주 팽팽한 경쟁을 하고 있다면 내가 기부하는 5달러는 아주 요긴하게 사용될 거라고 생각하게 되기 때문이다. (현재 해리스는 선거자금에서 트럼프를 압도한다.)

반면 트럼프는 자체 여론조사를 기준으로 트럼프가 모든 격전지에서 해리스를 앞지르고 있다고 부풀린다. 물론 그런 조사는 언론에서는 공정성이나 가치를 인정하지 않는다. 하지만 언론이 민주당 편향이라고 믿는 트럼프 지지자들은 그런 트럼프의 주장대로 트럼프가 "당연히 이긴다"고 믿는다. 이렇게 굳게 믿는 사람들은 트럼프가 패할 경우 부정선거가 분명하다고 생각하게 된다. 뉴욕타임즈는 요즘 트럼프와 지지자들이 내세우는 "Too Big to Rig(조작하기에는 너무 큰 격차)"라는 메시지는 표면적으로는 민주당이 부정을 저질러도 이길 수 있게 하자는 얘기지만, 사실은 트럼프 지지자들에게 승리는 기정사실이라는 인상을 주려는 것이라고 설명한다.

(이미지 출처: Washington Post)

해리스 선본의 확신

그런데 며칠 전부터 해리스의 선거운동본부에서 이번 선거에서 이길 것 같다는 메시지를 조심스럽게 흘리기 시작했다. 내부적으로 진행하는 여론조사 결과 그렇게 판단했다는 거였다. 지난주에는 기사를 통해 흘러나왔는데, 이번 주에 들어서는 아예 선거운동 총책임자가 방송에 나와서 승리를 확신하는 말을 했다. "우리는 승리한다고 확신합니다. 우리가 이기고 싶어서 이런 말을 하는 게 아니라, 숫자를 보고 하는 말입니다." 여전히 아주 박빙의 승부가 되겠지만, 유권자들의 사전선거율과 현장의 분위기를 보면 해리스의 승리를 확신한다고 했다.

자체 여론조사는 양당이 모두 실시하지만 언론은 이를 쉽게 믿지 않고, 당연히 그걸 공개하는 의도를 고려해서 해석해야 한다. 그런데 트럼프 쪽에서는 (위에서 설명한 이유처럼) 이기고 있다는 메시지를 내보낼 필요가 있지만, 해리스 선거운동본부는 왜 갑자기 이런 메시지를 내보내기로 한 걸까?

앞서 이야기한 것처럼 민주당은 승리를 확신한다는 말을 해서 특별히 좋을 게 없다. 따라서 웬만큼 확실하고 객관적인 증거를 발견하기 전에는 이런 말을 하지 않을 것이다. 해리스 쪽에서 이런 자신감을 보인 것과 거의 동시에 주요 경합주인 위스컨신주미시건주에서 해리스가 트럼프를 각각 6포인트, 5포인트 앞서고 있다는 조사 결과가 나왔다. (위스컨신: 해리스 51%, 트럼프 45%, 미시건: 해리스 48%, 트럼프 43%). 위스컨신, 미시건은 펜실베이니아주와 함께 한 때 민주당의 아성("Blue Wall")이었고, 해리스의 승리에 결정적인 역할을 할 수 있다. 해리스가 만약 위스컨신, 미시건, 펜실베이니아를 모두 가져올 수 있으면 다른 주의 결과는 볼 필요도 없이 승리한다. 이 여론조사 하나가 다른 모든 조사를 무시할 만큼 정확하냐면, 반드시 그렇지는 않다. (참고로, 이 조사를 수행한 SSRS는 별점 2.4로, 538개 여론조사기관 중 신뢰도 랭킹 55위다.)

그런데 이와 거의 동시에 트럼프가 소셜미디어에 "펜실베이니아에서 부정 투표가 일어나고 있다"며 자기 지지자들에게 신고하라고 독려하는 메시지를 올려서 주목을 받았다. 선거 결과에 불응하려는 그의 전략은 이미 잘 알려졌지만, 왜 하필 펜실베이니아일까? (트럼프는 항상 그렇듯 이번에도 그런 주장을 하는 근거는 전혀 제시하지 않았다.)

어떤이들은 트럼프가 펜실베이니아에서 패할 가능성을 발견한 것으로 해석한다. 사전투표율 등으로 현장의 체감 온도를 파악하려는 노력은 공화당에서도 하는데, 펜실베이니아가 해리스에게 넘어갈 가능성을 감지했고, 이를 선거 부정으로 몰아 무효로 만들기 위해 가짜 뉴스를 만들어 사전 작업에 들어갔다는 것이다. (펜실베이니아는 경합주 7개 중에서 가장 많은 19명의 선거인단을 갖고 있기 때문에 이곳을 뺏기는 후보는 패할 가능성이 크다.)

요약하면, 해리스 선거운동본부는 자체 조사에서 승리에 대한 확신이 생겼고, 이를 뒷받침하는 외부 조사 결과도 나오기 시작했고, 무엇보다 트럼프가 펜실베이니아에서 빨간불이 들어온 걸 확인했다는 것이다.

(이미지 출처: The Hill, YouTube)

그렇다면 선거 막바지에 해리스의 지지율이 오르고 있는 것은 어떻게 해석해야 할까?

이코노미스트는 각종 여론조사 자료를 바탕으로 미국 대선 결과를 예측하는 페이지를 운영하고 있는데, 그동안 트럼프의 승리 가능성을 더 높게 보고 있었던 이곳에서 최근 해리스의 당선 가능성이 6포인트 증가하면서 두 후보는 완전한 동률이 되었다. 이코노미스트는 어제(30일) 별도의 기사를 통해 그 이유를 설명했는데, 해리스 지지율의 상승 원인 자체에 대한 설명은 아니지만, 해리스 선거운동본부가 희망을 갖게 된 이유를 짐작할 수 있다.

이코노미스트가 해리스의 승리 가능성을 6포인트 늘린 데는 세 가지 이유가 있다. 첫째, 새로 발표된 여론조사 65개의 결과를 적용했다. 둘째, 선거일까지 남은 시간이 거의 없다. 이제까지는 각 후보가 지지율을 끌어올릴 여지가 있었지만, 이제는 여론조사기관들이 이번 선거의 최종 보고서를 발표하고 있다. 따라서 지금부터 나오는 예측은 정확도가 높다.

마지막으로, 29일에 나온 미시건, 노스캐롤라이나, 펜실베이니아, 위스컨신의 여론조사에서 해리스의 예상 득표율은 아주 근소하게(0.4%) 상승했다. 하지만 이번 선거가 엄청나게 박빙이기 때문에 약간의 변화라도 승리 가능성에는 훨씬 더(6%) 커진다.

이코노미스트의 기사는 선거를 며칠 앞두고 나타난 변화는 몇 주, 몇 달 전에 나온 변화보다 훨씬 큰 위력을 갖기 때문에 트럼프가 6% 증가한 해리스의 가능성을 되돌리기는 훨씬 힘들다고 설명했다. 주의할 것은 이코노미스트가 해리스의 당선 가능성이 높다고 보는 건 아니라는 사실이다. 그 매체가 사용하는 모델에서는 뒤지고 있던 해리스가 트럼프와의 격차를 없앴다는 것뿐이다.

하지만 두 사람의 당선 가능성이 50대 50이라고 해서 결과도 반드시 그렇게 박빙으로 나온다고 생각하는 것도 착각이다. 파이브서티에이트에서는 두 후보 중 한 사람이 "넉넉하게(comfortably)" 이길 가능성 역시 표준 오차 범위 내에 있다고 한다. 즉, 둘 중 누구도 이길 수 있고, 이길 때는 충분한 표 차이로 이길 수 있다는 것이다. 🦦