최수연 네이버 대표 “하이퍼클로바X, 한국 사회의 맥락 모두 이해 차별화”

오픈AI 등 해외 LLM 대비 자신감 내비쳐…“‘클로바X’, GPT3.5 대비 승률 75% 높아”

2024-08-24 박효길 기자

매일일보 = 박효길 기자 | 최수연 네이버 대표가 자체 초거대언어모델(LLM) ‘하이퍼클로바X’에 대해 “한국어 표현 포함 한국 사회의 맥락, 제도, 법 모두 이해하고 있는 생성형 AI라는 점에서 가장 큰 차별점”이라며 ‘오픈A’I 등 해외 LLM 대비 ‘하이퍼클로바X’에 대한 자신감을 나타냈다.

최 대표는 24일 그랜드 인터컨티넨탈 서울 파르나스에서 팀네이버의 기술 방향성과 사업 전략을 공유하는 컨퍼런스 ‘DAN 23’ 질의응답 세션에서 이같이 밝혔다. 오픈AI 등과 비교해 네이버 만의 장점에 대해 최수연 대표는 “우선 자연스러운 한국어 표현 포함해서 한국 사회의 맥락, 제도, 법 그런 부분들을 모두 이해하고 있는 생성형 AI라는 점에서 가장 큰 차별점이 있다고 생각한다”며 “특히 저희가 생성형 AI를 바라는 관점은 기술적인 도구이기 때문에 이것들을 사용하시는 저희 중소상공인(SME)나 창작자분들이 결국 한국 시장을 타깃으로 한다는 점에서 저희 국내 파트너사에게 가장 최적화된 생성형 AI 기술이라 생각한다”고 밝혔다. 운영비용에 대해 그는 “생성형 AI라는 게 저희의 대규모 소비자거래(B2C) 서비스에 붙이기에는 여러 가지 비용 이슈가 있는 것이 맞다”며 “그래서 저희가 기업거래(B2B) 모델부터 수익화를 하면서 클로바X에 대한 검증을 계속해서 해 나갈 예정”이라고 했다. 이어 “B2C 서비스에 대해서는 기존까지 저희가 모든 기술적인 그런 전환기를 거쳤을 때 비용들이 올라가는 이슈들은 항상 있었지만 결과적으로는 그게 서비스의 경쟁력과 차별적으로 연결이 되면 저희의 수익으로 또 이어지는 그런 효과를 저희가 경험했었기 때문에 우선은 한정된 사용자들을 대상으로 베타 테스트를 진행해가면서 검증을 계속해 나갈 예정”이라고 덧붙였다. 구글 등 해외 플랫폼의 위협에 대해 최수연 대표는 “사실은 일괄된 기준을 가지고 집계하는 매체가 있는 것은 아니라서 저희는 내부적으로 저희 경쟁력을 판단하는 매출, 검색 만족도, 검색과 관련된 여러 활성화 지표 등 여러 지표들을 봤을 때는 견고하게 유지되고 있는 편”이라고 밝혔다. 이어 “생성형 AI에서 저희가 기술로 뾰족하게 계속해서 저희의 경쟁력을 유지해 나간다고 하면, 이용자들이 저희한테 결국 바라는 건 사실 검색”이라며 “그것에 대한 점유율이나 경쟁력은 유지해 나가고 오히려 더 강화할 수 있을 것이라고 자신하고 있다”고 했다.

성낙호

네이버판 챗GPT인 ‘클로바X’의 차별점에 대해 성낙호 네이버클라우드 하이퍼스케일AI 총괄은 “어떤 하나의 벤치마크로 이야기하는 건 어렵다”라며 “저희가 내부적으로 GPT3.5 대비로 정성 평가한 결과, 승률은 사실 상당히 높다”고 말했다. 이어 “특별히 그렇게 공신력 있는 자료는 아니지만, 저희 내부적인 지표로는 75% 정도의 승률을 갖고 있다”고 밝혔다. 이어 “GPT4 같은 경우는 굉장히 높은 수준의 성능을 보이고 있는데 굉장히 고비용 구조여서 지속가능하지 않았다”며 “GPT4에서 보여준 것들은 어떤 특정한 영역에 대해서 그만큼의 투자를 할 경우 AI가 그 정도의 성능을 보인다는 것을 실증한 바 있는데, 모든 영역에 대해서 많은 양의 데이터를 들이부어서 그 정도의 AI를 만들어 유지하는 건 쉽지 않다”고 했다. 그리고 “반대로 저희 클로바X의 전략은 사용자가 어떠한 것에 대해서 저희한테 실망하는지 빠르게 파악해서, 그 부분에 데이터를 집중적으로 투자해, 원하는 시장에서 원하는 인공지능을 빠르게 공급하는 것”이라며 “그런 것들을 달성하기 위한 실질적인 수단들을 이미 확보하고 있기 때문에, 저희가 오늘부터 서비스를 개시하면 그 문제를 해결해서 늦어도 몇 달 안에 충분히 강력한 것을 만들 수 있다고 기대한다”고 말했다. 스타트업이나 기업들 입장에서 오픈AI와 비교해서 하이퍼클로바X가 어떤 부분이 더 유리한지에 대해 최수연 대표는 “저희도 이번에 생성형 AI 모델을 공개하면서 가장 중요하게 생각했던 것이 이것들을 활용하는 기업들의 생태계를 어떻게 만들고 저희가 어떤 기여를 할 것인지에 대한 것”이라며 “저희와 제휴하거나 일하고 싶어 하시는 모든 분들은 사실 네이버에서 활동하시는 이용자들의 데이터들, 그리고 거기서 생성돼서 축적된 데이터들을 네이버가 어떻게 이해하고 있는지를 가장 궁금해한다”고 말했다. 이어 “하이퍼클로바X는 사실 그것을 학습했다”며 “또 그것들을 무궁무진하게 이용할 수 있는 길을 저희가 기술적으로 열어드릴 것이기 때문에 그 부분에서 가장 차별점이 있다”고 덧붙였다. 그리고 그는 “생산자 툴이라고 하면 기업 내부의 직원들이 쓰게 해주고 싶은데 사실은 그 기업의 정보들, 보고서들, 내부에 연구 자료들을 외국에 있는 클라우드에 올린다는 것은 사실 기업 입장에서는 보안의 이슈로 허용하기 어려운 부분”이라며 “저희는 뉴로클라우드라고 해서 아예 물리적으로 기업 자체의 데이터 센터를 보유하고 그 정보들이 전혀 기업의 내부망을 나가지 않고서도 하이버클로바를 이용할 수 있는 상품까지 준비했다”고 말했다.

최재호

네이버 검색이 ‘큐:’로 완전 변화하는 것인지에 대해 최재호 네이버 서치CIC 책임리더는 “네이버 검색이 전면적으로 ‘큐:’로 대체되는 것은 아니다”라며 “‘큐:’라는 것이 이제 복합적인 의도에 대해서도 되게 원하는 답변을 한 번에 줄 수 있는 기존에 이제 검색이 수행하지 못했던 기능을 추가하는 상호 보완적인 역할을 할 수 있을 거라고 생각한다”고 말했다. 이어 “그래서 이제 현상 자체도 큐:라는 결과를 이제 노출했을 때 사용자들에게 도움이 되는 경우가 있을 거라고 생각한다”며 “저희는 전반적으로 판단하고 그런 품질 요소들을 고려해서 이제 큐:를 적용할 예정이라고 이해하시면 좋을 것 같다”고 말했다. 이어 “그리고 이제 ‘큐:’도 계속해서 이제 학습이 되면서 더 똑똑해지는 부분도 있다”며 “하이퍼클로바X 백본 모델이 좋아지면 당연히 같이 좋아지는 부분도 있기 때문에 장기적으로 보면은 큐:가 검색 결과의 일부가 되지 않을까라는 생각하고 대체된다는 개념보다는 더 발전적인 방향으로 가고자 한다”고 덧붙였다. AI 환각 문제는 72%가 줄었다고 해도 여전히 존재하는데 해결할 방법에 대해 최수연 대표는 “할루시네이션(환각현상) 같은 경우에는 리즈닝이라든지 그다음에 출처 위주 결과를 저희가 생성해서 사용할 때, 그런 출처가 좀 더 분명한 문서들을 더 많이 사용한다든지 그다음에 답변 또 생성하는 과정에서도 한 번 더 그런 팩추얼로 일치하는지 아닌지를 확인하는 그런 처리들을 하는 절차들을 거쳐서 저희가 이제 보완을 하려고 하고 있다”며 “사실 큐:하고 저희 오늘 발표한 클로바 X하고 가장 큰 차이점이 이걸 얼마나 엄격하게 했는지, 그리고 거기에 얼마나 자유도를 뒀는지에 따라서 사실 검색형 질문에 대해서도 아마 답이 좀 다르신 거를 보실 수 있을 것 같다”고 밝혔다. 이어 “그래서 저희가 판단할 때는 이게 극복해야 될 과제이지만, 이 부분에 대해서 처음부터 아예 다 답변 자체를 출력할 수 없다고 하면, 이것들을 사용하시는 사용자라든지 창작자라든지 이런 분들께서 활용해 좀 한계를 빨리 느끼실 것 같아서 좀 클로바X는 상대적으로 자유도가 있는 모델, 그리고 큐:는 저희가 검색에 적용할 것을 아예 대비하고 만들기 때문에 그 부분을 엄격하게 보고 있다”고 말했다.