작년 말 오픈AI가 얼떨결에 쏘아 올린 챗GPT는 테크 업계에 하나의 신호탄이 되어 전 세계 테크 기업들이 본격적으로 AI에 질주하게 만들었다. 작은 스타트업부터 구글, 메타까지 AI가 올해의 화두가 되었지만, 특히 검색 비즈니스를 빼앗길 위험에 처한 구글의 경우 가장 다급한 상황이다. 구글은 어제 챗GPT(를 장착한 마이크로소프트의 검색 엔진 빙)에 대항하는 바드(Bard)를 일부 사용자들에게 공개했고, 중국의 대표 테크기업 바이두(Baidu) 역시 최근 어니(Ernie)를 선보였다. 모두가 기다리던 "다음번 거대 혁신(next big thing)"이 AI라는 것을 부정하는 사람은 찾기 힘들다.

당장 선두 주자는 오픈AI와 마이크로소프다. 구글이 공개한 바드를 사용해 본 어떤 기자는 챗GPT/빙(Bing)보다 속도가 빠르고 좀 더 부드럽지만 기능은 더 제한적이라는 평가를 내렸다. 잘못된 정보를 가져오는 경우도 종종 있었고, 무엇보다 "레퍼토리를 더 확대하지 않으면" 사람들이 챗GPT에서 바드로 관심을 돌리기 힘들 거라는 게 그 기자의 생각이었다. 바이두의 어니는 더 실수가 많아서 이 분야에서는 중국과 미국의 "기술력의 차이가 상당하다"는 평가가 나온다.

그런데 정작 이 모든 일을 지켜보며 가장 놀라고 머리를 긁적이는 사람들은 다름 아닌 챗GPT를 만든 사람들이다. 새로운 기술이 아니었고, 야심 찬 제품 발표도 아니었다. 진짜로 기대했던 서비스라면 모두가 발음하기도 힘들고 타이핑하기도 귀찮은 "ChatGPT" 같은 이름으로 발표했겠냐는 게 직원들의 말이다. 피드백을 얻기 위해 시험 삼아 공개해 봤다가 대박이 났다는 거다. 이들의 솔직한 심정을 담은 개발 과정의 뒷이야기를 듣고 싶었는데 드디어 이들의 인터뷰가 등장했다. MIT테크놀로지리뷰의 윌 더글러스 헤븐(Will Douglas Heaven)이 쓴 '챗GPT를 만든 사람들이 들려주는 뒷이야기(The inside story of how ChatGPT was built from the people who made it)'라는 제목의 글이다.


샌프란시스코에 위치한 인공지능(AI) 기업인 오픈AI는 지난해 11월 말 챗GPT(ChatGPT)를 별다른 홍보도 하지 않고 조용히 발표했다. 그때만 해도 대단한 기대를 하지 않았기 때문에 이 서비스가 폭발적인 바이럴을 일으켰을 때 오픈AI는 이런 인기에 대응할 준비가 되어있지 않았다. 그날 이후로 오픈AI는 정신없이 대응(하는 동시에 이 기회를 최대한 활용하는) 중이다.

이 회사에서 정책을 담당하고 있는 산디니 아가르왈(Sandhini Agarwal)에 따르면 애초에 사내에서는 챗GPT를 일종의 "연구 결과를 선보이는 프리뷰(a research preview)"로 받아들였다고 한다. 개발된 지 2년 된 기술을 조금 다듬어서 보여주는 맛보기 버전이었다는 것이다. 무엇보다 아직 결함이 남아있기 때문에 일반에 공개해서 피드백을 받으려는 의도였다. 챗GPT 개발에 참여한 과학자 리암 페더스(Liam Fedus)는 "우리는 이걸 근본적인 진보를 이룬 제품으로 과대 포장하고 싶지 않았다"라고 했다.

오픈AI의 본사 사무실이 있는 샌프란시스코의 파이오니어 빌딩. 사적으로 지정된 오래된 공장 건물로, 일론 머스크의 뉴럴링크도 이 빌딩에 입주해있다. (이미지 출처: Wikimedia Commons)

나는 이 챗봇이 어떻게 만들어졌고, 대중에 공개된 이후로 오픈AI가 이를 어떻게 업데이트해 왔는지, 그리고 챗GPT를 만든 사람들은 이런 큰 성공을 어떻게 생각하는지 알고 싶어 개발에 참여했던 네 사람과 이야기를 나눴다. 아가르왈과 페더스 외에도 이 회사의 공동창업자인 존 슐먼(John Schulman), 그리고 오픈AI의 얼라인먼트팀(alignment team, 사용자들의 기대치에 맞추는 작업을 한다)을 이끄는 얀 레이키(Jan Leike)가 그들이다.

이들을 인터뷰하면서 받은 인상은 오픈AI는 연구 프리뷰 버전의 성공을 아직도 신기하게 생각하지만, 이 기술을 발전시킬 좋은 기회라고 생각하고 놓치지 않으려 한다는 것이다. 그들은 수백만 명이 챗GPT를 사용하는 모습을 지켜보고 있고, 발생할 수 있는 최악의 문제들을 해결하고 있다.  

오픈AI는 지난 11월 공개 이후로 챗GPT를 벌써 여러 차례 업데이트했다. 연구원들은 사용자들이 챗GPT를 허락되지 않은 용도에 악용하는 것(이를 jailbreaking, 즉 탈옥이라 부른다)을 막기 위해 적대적 훈련(adversarial training)이라 불리는 테크닉을 사용하고 있다. 이는 여러 개의 챗봇이 서로 대화하게 하는 방법으로, 한 챗봇이 악역을 맡아 다른 챗봇이 자신의 제한된 용도를 뛰어넘어 원하지 않는 결과를 산출하도록 하는 질문 텍스트를 만들어내게 하는 식이다. 이런 공격에 뚫리는 일이 발생하면 이를 챗GPT를 훈련시키는 데이터에 넣어 사용자들의 요청을 무시하게 만든다.

오픈AI는 이미 마이크로소프트와 수십억 달러 규모의 계약을 체결했고, 세계적인 컨설팅 기업인 베인앤컴퍼니(Bain & Company)와도 제휴한다고 발표했다. 베인앤컴퍼니는 코카콜라를 비롯한 자사의 클라이언트들의 마케팅 캠페인에 오픈AI의 생성형 인공지능(generative AI, 줄여서 '생성 AI'라 부른다)을 사용할 계획이다. 챗GPT에 대한 입소문이 퍼지면서 오픈AI 외에도 대규모 언어 모델(large language model, LLM)을 둘러싼 골드러시가 일어났고, 전 세계의 기업과 투자자들이 뛰어들고 있다.  

이 모든 게 단 3개월 안에 일어났다는 건 이에 대한 관심이 얼마나 대단한지 보여준다. 챗GPT는 어디에서 왔을까? 이 서비스가 출시해도 된다고 판단하기까지 오픈AI는 어떤 절차를 거쳤을까? 오픈AI는 앞으로 어떤 계획을 가지고 있을까? 직접 들어보기로 하자.

길이와 내용의 명확성을 위해 인터뷰 내용을 일부 편집했다.

왼쪽 위부터 시계 방향으로 리암 페더스, 산디니 아가르왈, 얀 레이키, 존 슐먼 (이미지 출처: 본인의 소셜 계정)

얀 레이키: 솔직히 말하면 너무 벅찼다. 우리는 깜짝 놀랐고, 그 뒤로는 대응하기에 바빴다.

존 슐먼: 서비스가 공개된 후 며칠 동안 트위터를 열심히 확인했다. 한동안은 트위터 피드가 챗GPT 스크린샷으로 도배되기도 했다. 챗GPT가 사용자에게 직관적으로 다가갈 거라 예상은 했었고, 제법 많은 사람들이 관심을 보일 것은 알고 있었지만, 이 정도로 주류의(mainstream) 인기를 끌 줄은 예상하지 못했다.

산디니 아가르왈: 우리는 이렇게 많은 사람들이 챗GPT를 쓸 줄 몰랐고, 그래서 놀랐던 게 사실이다. 우리는 AI 모델을 하도 오래 연구해왔기 때문에 일반인들에게 이게 얼마나 놀랍게 보일지 잊곤 한다.

리암 페더스: 사람들의 반응이 열렬해서 놀란 건 사실이다. 하지만 과거에도 범용(general-purpose) 챗봇을 만들려는 시도가 많이 있었기 때문에 이번에도 승산이 크지 않다고 생각했다. 다만 비공개 베타 테스트를 해본 결과, 사람들 아주 좋아할 요소가 있다고 확신할 수 있었다.

얀 레이키: 나는 도대체 왜 다들 그렇게 좋아하는지 알고 싶다. 이런 바이럴이 일어나는 이유가 궁금하다. 그냥 하는 말이 아니라, 정말로 궁금하다. 우리도 몰라서 그렇다.

2016년 오픈AI 직원들의 모습. 맨 위 사진 속 건물의 내부. (이미지 출처: CEO 샘 알트먼의 트위터)

챗GPT 개발팀이 의아하게 생각하는 이유 중 하나는 챗GPT 안에 들어간 기술이 새로운 게 아니라는 사실이다. 챗GPT는 오픈AI가 그보다 몇 달 전에 내놓은 LLM 모델 계열인 GPT-3.5를 미세 조정한 버전이고, GPT-3.5는 2020년에 나온 GPT-3을 업데이트한 버전이었다. 오픈AI는 이런 AI 모델들을 API로 웹사이트에 공개해서 소프트웨어 개발자들이 자신이 만든 코드에 이를 삽입할 수 있게 하고 있다. 오픈 AI는 이미 인스트럭트GPT(InstructGPT)라는 이름으로 GPT-3.5를 미세 조정한 버전을 공개한 적이 있다. 하지만 이들 버전은 일반인들에게는 홍보하지 않았다.

리암 페더스: 챗GPT 모델은 같은 모델에 기반한 인스트럭트GPT를 미세 조정한 것이고, 미세 조정을 할 때도 똑같은 방법론을 적용했다. 대화형 데이터를 추가했고, 훈련 과정을 약간 바꿨을 뿐이다. 이런 이유로 우리는 챗GPT가 이전에 우리가 발표한 것들보다 근본적으로 발전된 모델이라고 홍보하고 싶지 않았다. 나중에야 알게 된 일이지만 이렇게 추가한 대화형 데이터가 챗GPT에 준 긍정적 영향이 컸다.

존 슐먼: 표준 벤치마크로 평가할 수 있는 기반 기술만 보면 두 모델(인스트럭트GPT, 챗GPT) 사이에는 별 차이가 없지만, 챗GPT는 (일반인이) 접근해서 사용하기에 더 용이하다.  

얀 레이키: 어떤 의미에서 챗GPT는 우리가 한동안 사용하던 AI 시스템의 한 버전에 불과하다. 우리가 이미 가지고 있던 모델에 비해 근본적으로 더 뛰어난 게 아니다. 챗GPT가 나오기 거의 1년 전에 사실상 똑같은 모델이 API로 이미 제공되고 있었다. 다른 의미에서는 우리가 이를 사람들이 사용하고 싶어 하는 쪽으로 조정을 한 것이다. 챗GPT는 일상어로 사용자와 대화하고, 챗이라는 인터페이스로 쉽게 접근할 수 있을 뿐 아니라, 사용자에게 도움이 되려고 애쓴다. 그렇게 생각하면 엄청난 발전이다. 사람들이 그걸 깨달은 게 아닐까.

존 슐먼: 챗GPT는 사용자의 의도를 더 빠르게 추측한다. 사용자들은 이런 챗GPT와 대화를 주고받는 과정에서 원하는 답을 얻을 수 있는 거다.


'챗GPT 뒷이야기 ②'에서 이어집니다.