스캐터랩 ‘제타’, AI 특화 ‘카카오클라우드’로 전환

국내 최초 인터랙티브 AI 콘텐츠 플랫폼에 카카오클라우드 도입 기존 클라우드 대비 채팅 1회 당 약 ‘3분의 1’의 비용 절감 효과

2024-09-26 김성지 기자

사진=카카오엔터프

매일일보 = 김성지 기자 | 카카오엔터프라이즈는 인공지능(AI) 스타트업 스캐터랩이 카카오클라우드 기반으로 최근 출시한 인터랙티브 AI 콘텐츠 플랫폼 ‘제타’를 서비스하고 있다고 26일 밝혔다.

지난 4월 출시된 제타는 국내 최초로 AI와 함께 실시간으로 스토리를 창작할 수 있는 플랫폼이다. 사용자가 자신이 만들고 싶은 캐릭터의 이름, 이미지, 특징 등을 입력하면 스캐터랩의 생성 AI 기술이 해당 내용을 스토리와 대화에 반영한다. 스캐터랩은 감성 대화에 탁월한 성능을 보이는 자체 AI 언어 모델을 파인튜닝해 제타에 적용했으며 지속적으로 모델 최적화 및 서빙 작업을 진행 중이다. 출시 이후 제타는 매달 2배 이상의 트래픽 증가세를 보였고 이에 따라 더 많은 GPU가 필요하게 됐다. 스캐터랩은 사용자 접속량과 수요에 맞춰 GPU 사용량에 따라 가변적으로 조절할 수 있고 빠른 응답속도와 안정성, 가격 합리성을 모두 갖춘 카카오클라우드의 서비스형GPU(GPUaaS)를 선택했다. 제타는 카카오클라우드의 클라우드 컴퓨팅 서비스인 BCS 중 컴퓨팅 성능을 가속화하는 기술이 적용된 GPU 인스턴스를 기반으로 운영된다. 카카오클라우드의 GPU 인스턴스는 대규모 데이터 세트에서 빠른 속도로 AI 모델을 학습시키거나 고성능 그래픽 애플리케이션, 게임 등을 실행하는 사용 사례에 적합하다. 기존에 사용하던 해외 GPUaaS의 경우 지리적으로 떨어져 있어 데이터 전송 지연 등 사용자 불편을 초래하는 경우가 있었지만, 카카오클라우드는 신속한 네트워크 처리 속도와 안정성을 제공해 지연 문제를 해결하고 사용자의 불만사항 접수도 크게 줄었다. 또 안정적인 자원 할당량 규모와 스케일링 용이성 덕분에 인프라 걱정을 크게 덜 수 있었다. 비용 측면에서도 기존에 사용했던 클라우드 서비스 대비 채팅 1회 당 약 3분의 1의 비용이 절감되는 것으로 추산됐다. 스캐터랩은 향후 거대언어모델(LLM) 활용을 확대하고 이미지를 생성하는 등 GPU 위주의 고부하 작업을 필요로 하는 신규 기능을 준비하고 있다. 신규 기능 도입을 검토할 때, 카카오클라우드를 통한 예산 절감 효과로 배포 사이클 또한 빨라져 더욱 빠르게 사업을 확장할 수 있게 됐다. 김종윤 스캐터랩 대표는 "다양한 GPU 선택지, 인프라 안정성, 네트워크 성능을 제공하는 CSP를 모색한 끝에 카카오클라우드 도입을 결정하게 됐다"며 "카카오클라우드의 안정적인 인프라를 기반으로 서비스를 고도화해 글로벌 AI 콘텐츠 비즈니스 기업으로 도약할 것"이라고 전했다. 이재한 카카오엔터프라이즈 최고사업책임자(CBO)는 “많은 기업이 전 세계적인 GPU 부족 현상으로 인해 AI 프로젝트를 추진하는 데 어려움을 겪거나 GPU 자원 확보와 관리에 많은 시간과 노력을 쏟고있는 것이 현실”이라며 “카카오클라우드의 AI 특화 클라우드를 통해 국내 기업들의 겪고 있는 GPU 부족 및 고비용 문제를 다소 해결할 수 있도록 최선의 노력을 다할 것"이라고 밝혔다.