닫기

글로벌이코노믹

'AI 학습 데이터' 스타트업 각축전 시작됐다

공유
0

'AI 학습 데이터' 스타트업 각축전 시작됐다

크라우드웍스·슈퍼브에이아이·알디프로젝트 등 사람과 AI 협업으로 효율적 시스템 구축 중

디지털 뉴딜정책과 데이터 3법(개인정보보호법·정보통신망법·신용정보법) 개정안 통과로 인공지능(AI) 학습 데이터 스타트업의 면면에 관심이 급증하고 있다.

4일 업계에 따르면 크라우드웍스, 슈퍼브에이아이, 알디프로젝트 등의 스타트업들이 AI 학습 데이터 시장에 두각을 나타내고 있다. AI 산업의 핵심은 데이터다. AI 학습 데이터는 데이터 라벨링의 정확도와 데이터 구축 작업 전반에서의 품질 관리가 필수인데 이 스타트업들이 두각을 나타내고 있는 것이다.
◇ 크라우드웍스 "AI와 인간이 협업할 수 있는 생태계 강화 중점"

네이버, 삼성, LG, 현대차, SK, 현대카드 등 국내 굴지의 기업들이 크라우드웍스의 주요 고객이다. 자료=크라우드웍스
네이버, 삼성, LG, 현대차, SK, 현대카드 등 국내 굴지의 기업들이 크라우드웍스의 주요 고객이다. 자료=크라우드웍스
크라우드웍스의 AI 학습용 데이터 수집·가공 비즈니스는 고객이 요구하는 머싱러닝과 AI 기술을 훈련시키는 원천 데이터를 제공한다. 고객들은 이를 이용해 AI 서비스의 성능을 향상시키거나 조직의 데이터 가치를 높이게 된다.

최근 크라우드웍스는 과학기술정보통신부가 추진하는 딥페이크 방지영상과 랜드마크 이미지의 AI 학습용 데이터 구축 사업을 수주했다. 크라우드웍스의 장점은 플랫폼에 등록된 15만 명 이상의 작업자를 활용해 데이터 전처리 과정으로 진행한다는 점이다.

크라우드웍스는 AI 산업의 가치가 데이터보다 사람 그 자체에 있다고 본다. 크라우드웍스는 AI와 인간이 협업할 수 있는 생태계를 통해서 플랫폼 노동의 패러다임을 바꾸길 기대한다. 4차 산업혁명시대,AI시대에는 인간없이 AI개발은 혁신할 수 없으며 또한 AI없이 인간의 혁신도 어렵다고 생각하기 때문이다.

박민우 크라우드웍스 대표는 "AI 산업에서 지도학습 기반의 서비스가 주류를 이룰 것"이라며 "양질의 데이터 가공인력을 확보하는 것은 국가차원에서도 중요한 일이다"고 설명했다. 박 대표는 "AI 학습 데이터 라벨링 일자리는 과거 공공근로사업처럼 제한된 국민에게 지원되는 형태가 아니라 보다 보편적이고 다양한 국민들에게 기회가 공평하게 주어진다는 점에서 가치가 있다고 본다"면서 "누구든지 어디서든지 시간과 공간의 제약 없이 온라인 환경에서 투자한 시간만큼 공정하게 자원이 분배된다는 점에서 일상에서의 혁신이 이루어질 수 있을 것"이라고 설명했다.

◇ 슈퍼브에이아이 "기술 고도화와 글로벌 시장 확장에 총력"


슈퍼브에이아이는 지난달 13일 데이터 라벨링 전문성 강화 프로그램 교육을 성황리에 마쳤다. 사진=한현주기자이미지 확대보기
슈퍼브에이아이는 지난달 13일 데이터 라벨링 전문성 강화 프로그램 교육을 성황리에 마쳤다. 사진=한현주기자
슈퍼브에이아이는 머신러닝 데이터 B2B SaaS 플랫폼인 스위트(Suite)의 기술을 고도화하고, 글로벌 시장을 확장하기 위해 총력을 기울이고 있다. 스위트 기술은 기존에 100시간이 필요했던 데이터 구축, 분석, 관리 등의 개발 과정을 28시간 수준으로 줄일 수 있어, 인공지능 데이터 분야에서 독보적인 기술력과 경쟁력을 입증했다.

지난 6월에는 ‘디지털 뉴딜’ 혁신 기업으로 선정돼 ‘한국판 뉴딜, 디지털경제 현장방문’서 정부 관계자를 대상으로 ‘슈퍼브에이아이 스위트(Superb AI Suite)’를 함께 사용해 보기도 했다.

슈퍼브에이아이는 국내 외 약 50개 회사를 고객사로 두고 있으며, 자율주행, CCTV, 사람행동인식, 항공 위성, 의료 AI, 모바일 AI 등의 다양한 프로젝트를 수행한다. 이와 더불어 인공지능 데이터 가공 기업을 육성하는 데이터 라벨링 전문성 강화 프로그램을 하고 있으며, AI 데이터 플랫폼 시장에서 인공지능 산업 활성화와 경쟁력 확보에 앞장서고 있다.

김현수 슈퍼브에이아이 대표는 "인공지능 데이터 가공 기업을 육성하는 데이터 라벨링 전문성 강화 프로그램 바탕으로 생태계 확장을 위한 노력을 지속해 나가겠다"면서“디지털 뉴딜 정책과 데이터 3법 시행 등으로 데이터를 효율적으로 라벨링하고, 데이터의 품질도 끌어올릴 수 있는 스위트의 활용도가 더욱 커질 것으로 기대한다”고 말했다.

◇ 알디 프로젝트 "양질의 일자리 제공 집중"


데이터메이커를 통해 가공된 데이터는 약 30개의 연구 개발 스타트업, KAIST 등의 대학과 연구기관에 폭넓게 활용되고 있다. 사진=알디프로젝트이미지 확대보기
데이터메이커를 통해 가공된 데이터는 약 30개의 연구 개발 스타트업, KAIST 등의 대학과 연구기관에 폭넓게 활용되고 있다. 사진=알디프로젝트
데이터메이커 플랫폼을 운영하는 스타트업 알디프로젝트는 고난이도 이미지 데이터 가공 분야인 '시맨틱 세그멘테이션(Semantic Segmentation)'에 특화됐다.

알디프로젝트는 데이터가 필요한 AI 기업들이 최대한 가공 비용 부담을 덜 느낄 수 있도록 효율적인 프로세스를 구축하고 있으며 이를 통해 양질의 일자리를 대한민국과 아프리카에 창출한다는 점이 높게 평가받고 있다.

최근 이러한 가치를 인정받아 신용보증기금으로부터 7억 원 규모의 투자를 유치했다. 데이터메이커를 통해 가공된 데이터는 약 30개의 연구 개발 스타트업, KAIST 등의 대학과 연구기관에 폭넓게 활용되고 있다. 데이터바우처와 데이터셋 구축사업 등 디지털 뉴딜 정책관련 정부 사업 수행과 다양한 AI 전문 기업 고객사와의 협업도 지속 확장 중이다.

알디프로젝트의 데이터 메이커 플랫폼에서는 현재까지 총120여개의 크고 작은 프로젝트를 통해 이미지, 음성, 텍스트 등의 다양한 형식의 데이터들이 수집·가공됐다.

최근에는 의료와 시설안전 등 특수 산업분야의 고난도 레이블링을 수행해 데이터 구축이 가능한 전문 분야의 폭을 넓히고 있다.

올해 하반기에는 데이터셋 구축 사업 등 대량의 데이터들을 처리할 수 있도록 플랫폼을 더욱 확장할 계획이다. 아울러 데이터 가공의 효율 증대를 위한 AI엔진 개발 등을 계획하고 있다.

이에녹 알디프로젝트 대표는 "디지털 뉴딜과 함께 AI데이터 산업에 대한 관심과 활용도가 높아지고 있다"면서"엄격한 품질관리로 우수한 데이터를 가공하며 보안과 효율을 중점으로 관리해 많은 고객이 신뢰할 수 있는 데이터메이커 플랫폼으로 발전시킬 계획"이라고 말했다.


한현주 글로벌이코노믹 기자 kamsa0912@g-enews.com