[AI경제]국내 ICT업계, 차세대 AI 개발 총력
네이버, GPT-3 넘는 초거대 AI '하이퍼클로바' 공개 LG AI 연구원, 3년간 1억달러 투자해 초거대 AI 개발 SK텔레콤, 올 연말까지 GPT-3 수준의 ‘GLM’ 개발 KT, 연내 카이스트와 ‘AI·SW 기술 연구소’ 설립
2021-06-01 박효길 기자
◇네이버, 초거대 AI ‘하이퍼클로바’ 공개
‘하이퍼클로바’는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI다. 하이퍼클로바는 오픈AI의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(매개변수) 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록, AI는 더욱 많은 문제를 해결할 수 있게 된다. GPT-3는 오픈AI가 개발한 영어 기반의 최신 AI 언어 모델로, 기존 GPT-2보다 자연스러운 언어 표현이 가능하고 범용적 사용이 가능하다는 것이 특징이다. 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한, 현재 전세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써, AI 주권을 확보한다는 의미도 있다. 이를 위해 네이버는 지난해 10월 국내 기업 최초로 700페타플롭(PF) 성능의 슈퍼컴퓨터를 도입하며, 대용량 데이터 처리를 위한 인프라를 갖췄다. 국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로바만의 중요한 경쟁력이다. 네이버는 하이퍼클로바 개발을 위해 5600억개 토큰의 한국어 대용량 데이터를 구축했다.◇LG AI연구원, 3년간 1억달러 투자해 하반기 초거대 AI 선뵐 예정
지난해 11월 출범한 LG AI연구원은 GPT-3를 뛰어넘는 초거대 AI를 목표로 하고 있다. 3년간 1억달러(약 1130억원)를 투자해 올 하반기 GPT-3의 3.4배 수준인 6000억개 파라미터를 갖춘 초거대 AI를 선보인다는 방침이다. LG AI연구원은 ‘초거대 AI’ 개발을 위해 1초에 9경5700조번의 연산 처리가 가능한 글로벌 톱3 수준의 AI 컴퓨팅 인프라를 구축하고, 계속 세계 최고 수준으로 확장해 나갈 계획이다. LG는 미국 AI연구소 ‘오픈AI’가 개발한 현존하는 가장 뛰어난 초거대 AI 언어모델인 GPT-3가 보유한 1750억개 파라미터의 3배를 넘어선 6000억개 파라미터를 갖춘 ‘초거대 AI’를 올 하반기에 공개한다.◇SK텔레콤, 차세대 AI 한국어 모델 ‘GLM’ 개발
SK텔레콤도 GPT-3와 유사한 수준의 초거대 AI를 준비 중이다. SKT가 개발하는 GLM은 1500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다. 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고, 보다 높은 정확도와 넓은 활용도를 갖고 있는 점을 감안하면, GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다. SKT는 올해 말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한, 한국어 언어모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다. SKT는 2018년부터 AI 언어모델을 개발해 왔으며, 2019년 KoBERT를 개발하여 챗봇 등에 활용하고 있다, 지난해 4월 KoGPT-2를 개발 완료해 챗봇의 대화를 보다 자연스럽게 발전시켰으며, 지난해 10월에는 뉴스나 문서를 고품질 요약문으로 만들어내는 능력 등 텍스트 처리 역량이 뛰어난 KoBART를 개발해 자연어 이해/처리 영역의 기술력을 강화해 왔다.◇KT ‘AI 원팀’ 산학연 AI 연구개발 첫 성과 공개