이 같은 단점을 개선하기 위한 인공지능(AI) 반도체를 국내 연구진이 개발했다. 해당 반도체는 기존 대비 평균 111배 빠른 것으로 확인됐다.
최근 검색 서비스에서 사용되는 알고리즘은 근사 근접 이웃 탐색(ANNS)으로 어떤 데이터든지 특징 벡터로 표현할 수 있다. 특징 벡터란 데이터가 가지는 특징들 각각을 숫자로 표현해 나열한 것으로, 이들 사이의 거리를 통해 우리는 데이터 간의 유사도를 구할 수 있다.
정명수 교수 연구팀은 메모리 확장의 제한이라는 근본적인 문제를 해결하기 위해 CXL이라는 기술에 주목했다. CXL은 CPU-장치 간 연결을 위한 프로토콜로, 가속기 및 메모리 확장기의 고속 연결을 제공한다. 또한 CXL 스위치를 통해 여러 대의 메모리 확장기를 하나의 포트에 연결할 수 있는 확장성을 제공한다. 하지만 CXL을 통한 메모리 확장은 로컬 메모리와 비교해 메모리 접근 시간이 증가하는 단점을 가지고 있다.
데이터를 책으로 비유하자면 기존 시스템은 집에 해당하는 CPU 크기의 제한으로 서재(메모리 용량)를 무한정 늘릴 수 없어 보관할 수 있는 책 개수에 제한이 있는 것이다. 이에 '압축 방식'은 책의 내용을 압축해 더 많은 책을 보관하는 방법이고, '스토리지 방식'은 필요한 책들을 거리가 먼 도서관에서 구해 오는 것과 비슷하다. CXL을 통한 메모리 확장은 집 옆에 창고를 지어 책을 보관하는 것으로 이해될 수 있다.
연구진이 개발한 AI 반도체(CXL-ANNS)는 CXL 스위치와 CXL 메모리 확장기를 사용해 근사 근접 이웃 탐색에서 필요한 모든 데이터를 메모리에 적재할 수 있어 정확도를 높이고 성능 감소를 없앴다. 또 ANNS의 특징을 활용해 데이터 근처 처리 기법과 지역성을 활용한 데이터 배치 기법으로 CXL-ANNS의 성능을 한 단계 상향했다.
연구진은 CXL-ANNS의 프로토타입을 자체 제작해 실효성을 확인하고 CXL-ANNS 성능을 기존 연구들과 비교했다. 마이크로소프트, 메타, 얀덱스 등의 글로벌 IT 기업에서 공개한 검색 데이터 셋을 사용한 ANNS의 성능 비교에서 CXL-ANNS는 기존 연구들 대비 평균 111배 성능 향상이 있었다. 특히 마이크로소프트의 상용화된 서비스에서 사용되는 방식과 비교했을 때 92배의 성능 향상을 보여줬다.
정명수 교수는 "이번에 개발한 CXL-ANNS는 기존 검색엔진의 문제였던 메모리 용량 제한 문제를 해결하고, CXL 기반의 메모리 확장이 실제로 적용될 때 발생하는 메모리 접근 시간 지연 문제를 해결했다"며 "제안하는 CXL 기반 메모리 확장과 데이터 근처 처리 가속의 패러다임은 검색엔진뿐만 아니라 빅데이터가 필요한 고성능 컴퓨팅, 유전자 탐색, 영상 처리 등의 다양한 분야에도 적용할 수 있다"고 말했다.
이번 연구는 미국 보스턴에서 오는 7월에 열릴 시스템 분야 최우수 학술대회인 유즈닉스 연례 회의 'USENIX Annual Technical Conference, 2023'에 'CXL-ANNS'이라는 이름으로 발표될 예정이다.
한편 해당 연구는 파네시아의 지원을 받아 진행됐다.
여용준 글로벌이코노믹 기자 dd0930@g-enews.com