지난해 말 테크업계를 뜨겁게 달구었던 주제는–일론 머스크와 트위터, 테슬라를 제외하면–바로 ChatGPT(챗지피티)의 등장이다. 우리에게 이미 DALL-E(달리)2로 즐거움을 선사해준 OpenAI(오픈에이아이)에서 만들어낸 ChatGPT는 등장과 함께 여러 개의 산업을 송두리째 바꿔 놓을 기술이라는 두려움과 기대가 섞인 전망이 쏟아져 나왔다.

DALL-E 2는 왼쪽과 같은 그림을 만들어낼 수 있다. 오른쪽은 샌프란시스코에 위치한 OpenAI 본사 건물

ChatGPT에서 chat은 채팅, 챗봇을 말할 때 그 '챗'인데 GPT는 무슨 뜻일까? 내가 설명하려 애쓸 필요 없이 ChatGPT에게 직접 물어보고 그 답을 들어보자. (ChatGPT의 능력과 한계를 이해하기 가장 좋은 방법은 직접 사용해보는 거다. 여기에서 누구나 무료로 사용해볼 수 있다. 영어로 물어보면 영어로, 한국어로 물어보면 한국어로 대답하기 때문에 언어의 장벽 없이 이용할 수 있다.)

질문은 아래와 같이 해봤다.

내가 인공지능 모델인 GPT를 직접 사용해본 사람의 얘기를 처음 들은 건 약 1년 전이다. 와히니 바라(Vauhini Vara)라는 테크 저널리스트가 GPT를 사용하면서 겪은 일을 상세하게 기록한 그 글은 자신이 어릴 때 세상을 떠난 언니에 관한 아주 개인적인 경험과 가장 발달한 인공지능이 만나는 아주 독특한 내용이다. 바라 기자는 글 쓰는 일을 직업으로 갖고 있지만 정작 자신에게 가장 아픈 기억인 언니의 죽음에 관해서는 글을 쓰지 못했다고 한다. (물론 굳이 써야 하는 건 아니다. 하지만 전에 오터레터에서 소개한 록산 게이가 체중에 관해서 글을 쓰는 게 너무 싫었기 때문에 반드시 써야 한다고 생각했다고 한 것처럼, 많은 작가들에게는 자신에게 가장 힘든 주제가 등반가들이 "힘들기 때문에" 올라야 하는 높은 산과 같은 존재다.)

그런데 GPT라는 인공지능 모델이 나왔다는 얘기를 들은 바라는 이 인공지능에게 자신이 하고 싶은 이야기를 대신 써보게 하고 싶어졌다. 어린 시절 언니와 나눈 대화, 함께 겪은 일들, 그리고 언니가 어떤 병으로 세상을 떠났는지 등의 정보를 짧게 입력하고 이를 바탕으로 GPT가 이야기를 만들어내게 한 것이다. 참고로 바라가 사용한 것은 GPT-3라는 버전이고, 아직 일반 대중에게 공개되지는 않았었다. 이번에 나온 ChatGPT는 이보다 좀 더 진보된 GPT-3.5를 기반으로 하고 있다.

와히니 바라의 경험담, Ghosts

바라의 경험을 여기에 옮기지는 않겠지만, 처음에는 전혀 무관한 이야기를 만들어내던 GPT는 바라가 자신의 언니에 관한 일화를 더 많이 들려주면서 점점 더 의미 있는 이야기를 만들어내기 시작했다고 한다.

물론 GPT는 사람처럼 생각하는 존재가 아니고, 대형 언어 모델(LLM, Large Language Model)을 사용한다. 즉, 방대한 텍스트 정보를 흡수해서 의미를 추론하고, 이를 바탕으로 주어진 질문에 대한 답을 내어놓는데, 그 과정에서 '다음에 올 단어는 무엇인가'를 찾아내는 데 그 핵심이 있다. 즉, 정답을 찾는 것이 아니라 자신이 흡수, 소화한 텍스트를 바탕으로 확률이 높은 답을 찾는 것이다. 그러니까 GPT가 한 번도 들어본 적 없는 새로운 이야기를 만들어낼 때조차 그 '재료'가 되는 텍스트 파편, 이야기의 파편은 언제, 어디선가, 누군가가 지어내거나 경험하고 글로 남긴 것이다.

하지만 그게 인간과 얼마나 다를까?

나는 예전에 유명한 작가가 쓴 단편 소설을 읽다가 조금 실망했던 기억이 있다. 많은 사람들의 사랑을 받는 거장의 작품을 대수롭지 않다고 말하려는 건 아니고 그럴 만큼 문학적 소양이 많은 것도 아니다. 다만 기대했던 것만큼 새롭지 않았다는 얘기다. 이야기의 전개도, 묘사도 재미있었고, 무엇보다 뛰어난 비유가 눈에 띄었지만, 특별히 새롭지는 않은, 상상 가능한 비유로 이야기를 끌고 간다는 생각에 중간을 지나면서 흥미를 좀 잃었다. 다른 사람이 썼다면 충분히 감탄하며 읽었을 텐데 그 작가에 대한 기대를 지나치게 크게 가졌던 것 같다.

그 작품은 살만 루슈디의 소설 'The Old Man in the Piazza'(광장의 노인)이었다.

결국 기대 수준의 문제였다. 만약 이제 막 데뷔한 신인 작가, 혹은 소설가 지망생의 작품이었다면 나도 훨씬 더 좋은 평가를 하지 않았을까?

GPT가 내놓는 답도 다르지 않다. 현재 버전인 GPT-3.5/ChatGPT가 아직 사람들이 놀랄 만한 새로운 내용을 가져 오지 않는다고 해도 사람들은 이를 잘 활용하고 있다. 특히 프로그래머들이 자신이 코딩한 내용에 오류가 있는지를 확인하는 데 더없이 좋다고 한다. 아니, 더 나아가서 단순한 코딩을 직접 해낼 수 있는 수준이라는 말도 있다.

이런 성능에 놀란 전문가들 중에는 "프로그래밍은 끝났다"라는 선언을 하는 사람도 있다. 맷 월시(Matt Walsh)는 Communications ACM에 기고한 칼럼에서 이제 전통적인 의미의 프로그래밍은 끝났으며, 사람들이 손으로 직접 프로그램을 짜는 세상에서 인공지능에게 우리가 원하는 프로그램을 만들어내도록 "가르치는" 세상으로 옮겨갈 수밖에 없다고 주장한다. 따라서 앞으로 컴퓨터 공학은 순수 프로그래밍에서 인공지능을 가르치는 방법론을 연구하는 교육학, 혹은 (인공지능) 심리학적 성격으로 바뀌게 된다는 것이다.
월시는 그런 변화의 결과로 컴퓨터 프로그램에 대한 장벽이 크게 낮아져서 모든 사람이 인공지능을 사용해 프로그래밍을 할 수 있는 세상이 된다는 낙관적인 견해를 갖고 있다. 그의 낙관론의 배경에는 지난 수십년 동안 컴퓨터 공학이 변화해온 역사가 있다. 컴퓨터 발전 초기만 해도 컴퓨터 엔지니어들은 소프트웨어를 이해하기 위해서는 반도체와 마이크로프로세서에 대한 상당한 지식이 있어야 했지만 요즘 프로그래머들 중에서 CPU가 실제로 어떻게 작동하는지를 이해하거나 트랜지스터 디자인에 어떤 물리학적 원리가 사용되는지 아는 사람은 거의 없다. 하지만 그걸 모른다고 해서 당장 필요한 프로그램을 짜는 데 아무런 문제가 되지 않는 것처럼, 앞으로 인공지능을 "부려서" 프로그램을 만드는 작업도 다르지 않다는 게 그의 주장이다.

뉴욕타임즈는 지난 크리스마스 직후에 흥미로운 퀴즈가 들어간 기사를 발행했다. "4학년 학생이 쓴 걸까요, 아니면 새로운 챗봇이 쓴 걸까요?"(Did a Fourth Grader Write This? Or the New Chatbot?)라는 제목의 이 기사는 세 개의 주제를 4학년과 8학년(우리나라의 중2)에게 내주고 짧은 글짓기를 하도록 해서 받은 글과 같은 주제를 ChatGPT에게 내어주고 각각 4학년 수준, 8학년 수준으로 글을 쓰게 해서 얻은 글 10편을 섞어서 보여준다. 독자들은 각각의 글을 읽고 인간 학생이 쓴 글인지 인공지능이 만들어낸 것인지 구분해야 한다. (이 문제는 여기에서 풀어볼 수 있다.)

아래는 그중 세 번째 문제.

나는 첫 세 문제를 모두 맞혔다. 사람만이 말할 수 있는 특정한 경험, 관점이 들어간 것과 아주 일반적인 서술을 구분할 수 있으면 어렵지 않게 풀 수 있는 수준이었다.

하지만 네 번째 문제부터는 어려워진다. (기사에서도 어려워진다고 경고한다.) 내가 보기에 분명히 사람만이 이야기할 만한 내용이라고 생각했지만 ChatGPT가 만들어낸 글이었고, 너무나 밋밋하고 평범해서 이건 당연히 인공지능의 작품이라고 생각했던 글은 인간 학생이 쓴 글이었다. 4~10번 중에서 내가 맞춘 것은 세네 개에 불과했다. 이 정도면 그냥 찍어도 나올 수준이었고, 답을 하면서도 전혀 확신이 들지 않았다. 만약 내가 초중고 교사였다면 학생들이 ChatGPT를 이용해 만들어낸 답을 구분하지 못하고 채점을 할 게 분명했다.

이런 일은 실제로 일어나고 있다. 미국에서는 벌써 초등학교부터 대학교까지 ChatGPT를 사용해서 만들어낸 숙제와 페이퍼가 쏟아지면서 교사들이 긴장하고 있다고 한다. OpenAI에서는 이런 일에 대비해서 쉽게 알아볼 수 없는 일종의 워터마크를 넣는다고 하고, 인공지능이 만들어낸 답을 구분해내는 인공지능 프로그램까지 나와있다. 하지만 학생들이 ChatGPT의 답을 그대로 옮기는 대신 적절히 활용만 하고 군데군데 바꿔서 제출한다면 교사들은 잡아낼 수 있을까? 학생이 인공지능의 도움을 받는 것은 교육적으로, 윤리적으로 정말 나쁜 일일까?

더 중요한 문제는 우리에게 요구되는 창의력이 어느 수준이냐는 것이다. 인간은 창의적인 존재라고 하지만 모든 사람이 항상 창의적인 건 아니다. 우리가 하는 말과 생각은 그저 어딘가에서 듣고 읽은 것의 반복, 혹은 잘해야 창의적 조합 정도에 불과할 때가 훨씬 많다. 천재라 불리는 르네상스 화가들이나 셰익스피어 같은 작가의 창작도 진공상태에서 이뤄진 것이 아니다. 선대, 혹은 동시대의 영향에서 완전히 자유로운 창작자는 없다. 하물며 천재와 거리가 먼 대다수의 사람들이 과연 얼마나 독창적인 사고를 할까? 중학생은? 초등학생은?

ChatGPT가 만들어낸 글과 인간 학생이 쓴 글을 구분하기 힘든 이유는 인공지능의 수준이 뛰어나서가 아니라 인간의 창의력이라는 게 대단하지 않기 때문이다.

이 주제로 유명한 밈(meme). "로봇이 교향곡을 쓸 수 있어?" "로봇이 텅 빈 캔바스에 명작을 그릴 수 있어?" "너는 할 수 있어?"

'기계 속 유령 ② 13개의 시나리오'에서 이어집니다.