닫기

글로벌이코노믹

[초점] 챗GPT의 대역설…저임금 알바 '데이터 라벨러’ 없으면 무용지물

글로벌이코노믹

글로벌비즈

공유
0

[초점] 챗GPT의 대역설…저임금 알바 '데이터 라벨러’ 없으면 무용지물

차량에 대한 데이터 라벨링 작업. 인공지능이 이해할 수 있도록 문서나 사진 자료에 대한 데이터를 일일이 새로 생성하는 작업이 데이터 라벨링이다. 사진=벤처비트이미지 확대보기
차량에 대한 데이터 라벨링 작업. 인공지능이 이해할 수 있도록 문서나 사진 자료에 대한 데이터를 일일이 새로 생성하는 작업이 데이터 라벨링이다. 사진=벤처비트
오픈AI가 개발해 전 세계적으로 돌풍을 일으키고 있는 챗GPT는 생성형 인공지능(AI) 기술의 일종이다.

챗GPT가 인류사적으로나 산업적으로나 의미가 큰 이유는 ‘자동화 기술의 총아’, 즉 ‘자동화 기술의 끝판왕’으로 평가받고 있기 때문이다.
오픈AI의 기업 가치가 하루가 다르게 치솟을 수밖에 없는 이유다. 그러나 챗GPT가 첨단의 첨단을 걷는 기술로 인정받는 것이, 기업 가치가 초고속으로 오르는 것이 곧 자동으로 떼돈을 버는 사업을 뜻하는 것은 아니다.

가까운 미래에 수익을 내기에는 지나치게 많은 천문학적 비용이 들어가는 기술이라서다. 오픈AI가 챗GPT의 공개 버전을 출시한 지 3개월도 되지 않은 시점에서 유료화에 나선 것도 바로 이 때문이다.
샘 올트먼 오픈AI 최고경영자의 표현을 빌리면 챗GPT를 가동하는 데, 즉 챗GPT의 컴퓨팅 비용은 “눈물이 날 정도”라고 한다. 외신에 따르면 오픈AI가 챗GPT를 단 하루 운영하는 데 들어가는 유지 비용은 적게 잡아도 10만 달러(약 1억3000만원), 많게 잡으면 70만 달러(약 9억3000만원) 수준으로 추정되고 있다.

그러나 8일(현지 시간) NBC뉴스에 따르면 오픈AI가 고용하고 있는 데이터 라벨러들이 시간당 버는 돈이 15달러(약 2만원)에 불과한 것으로 드러나 충격을 주고 있다.

천문학적인 비용이 투입되고 있는, 자동화 기술의 끝판왕이라는 챗GPT를 떠받치기 위해 저임금 알바 데이터 라벨러들이 동원되고 있다는 뜻이기 때문이다.

◇ 챗GPT와 데이터 라벨링의 관계


슈퍼컴퓨터를 이용해 챗GPT를 훈련하는 과정에서 들어가는 돈에 비하면 유지비는 약과다. 챗GPT를 한 차례 훈련시키는 데 드는 컴퓨팅 비용만 140만 달러(약 18억원) 수준인 것으로 추정되고 있기 때문이다.

챗GPT의 기반이 되는 ‘GPT-3’라는 이름의 대규모 언어 모델(LLM)을 가동하는 데 드는 비용이 이 정도라는 뜻이다. 챗GPT의 놀라운 추론 능력은 약 1750억 개의 매개변수를 지닌 이 언어 모델로 매일같이 훈련을 되풀이한 결과다.

그러나 챗GPT가 인간이 만든 문서나 자료를 사람처럼 직접 보고 이해하는 것은 아니다. 데이터 라벨러라는 신종 아르바이트가 생겨난 이유다. 데이터 라벨러는 사람이 만든 사진, 문서, 음성, 동영상 등의 데이터를 AI가 이해할 수 있도록 가공하는 일을 하는 직업이다.

데이터 라벨러가 AI를 위한 데이터를 만들어 주지 않으면 AI는 애초에 학습 자체가 불가능하다는 얘기다.

◇ 저임금 노동력 없이는 존재 불가능한 챗GPT


NBC뉴스는 오픈AI에 AI용 데이터를 제공하는 데이터 라벨링 전문업체에 속한 데이터 라벨러들을 취재한 결과 이 같은 사실을 확인했다고 전했다.

오픈AI가 이들 데이터 라벨러에게 시간당 지급하고 있는 임금은 15달러 수준인 것으로 나타났다는 것.

NBC뉴스는 “이들은 오픈AI가 지난 몇 년간 챗GPT를 개발하는 과정에 참여해 왔다”면서 “그러나 이들은 별도의 수당 없이 이 같은 저렴한 비용으로 일해온 것으로 나타났다”고 보도했다.

이들이 받은 돈은 일부 주에서는 주가 정한 법정 최저임금을 겨우 웃도는 정도로 적은 것으로 확인됐다고 NBC뉴스는 전했다.

NBC뉴스는 “데이터 라벨러에게 싼 임금을 줘 가면서 개발된 챗GPT가 오늘날 자동화 기술의 총아로 불리는 지위에 오른 것은 아이러니한 일”이라고 지적했다.

AI 전문 비영리 연구기관인 AI파트너십의 소남 진달 책임연구원은 NBC뉴스와의 인터뷰에서 “챗GPT 같은 최첨단 AI 기술도 알고 보면 저임금 노동자의 수작업에 의존하지 않고서는 등장할 수 없었다는 사실은 잘 알려지지 않았다”고 강조했다.


김현철 글로벌이코노믹 기자 rock@g-enews.com