네이버가 추론(reasoning) 능력을 강화한 생성형 AI 'HyperCLOVA X THINK(하이퍼클로바X씽크)' 개발을 완료하고, 모델의 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트를 30일 발표했다.
추론모델은 '생각하는 힘'이 강화된 AI다. 사용자가 질의를 입력하면 모델이 혼잣말하듯이 길게 생각하며 답변 계획을 수립한다. 이 과정에서 복잡한 문제를 작은 단위로 나누는 능력, 적절한 도구나 함수를 선택하는 능력, 실수를 반추하고 교정하는 능력이 발현되며 생성 정보의 정확도와 유용성을 끌어 올린다.
네이버에 따르면 하이퍼클로바X씽크는 추론 능력을 기반으로 언어에 대한 이해를 한층 높은 수준으로 끌어올린 게 특징이다.
'KoBALT-700' 벤치마크로 주요 LLM(거대언어모델)의 언어 능력을 측정한 결과, 유사 규모로 구축된 국내 주요 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 더 높은 점수를 기록했다. 해당 벤치마크는 서울대학교 언어학과에서 LLM의 깊이 있는 한국어 이해도를 진단하기 위해 설계됐으며, AI가 대화의 격률을 적절하게 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성됐다.
또 다른 대표적인 한국어 성능 평가 지표인 'HAERAE-Bench'에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다. 빠르게 대중화되고 있는 AI 에이전트 서비스에서 사용자와 모델 간 자유로운 언어적 상호작용의 중요성은 점점 커지는 만큼, 하이퍼클로바X씽크가 일상 속 다양한 상황네이버는 하이퍼클로바X씽크를 통해 AI가 언어뿐만 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했다. 테크니컬 리포트에 따르면 하이퍼클로바X씽크는 'STEM(Science, Technology, Engineering, Mathematics)' 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였다. 한국 대학수학능력시험 생명과학 문제에서, 그림으로 제시된 '생태계 천이 과정'과 '특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프'를 인식·분석하고 이를 양수림, 혼합림, 지의류 등에 대한 지식과 결합해 선택지 중 올바른 서술을 골라내는 식이다.
네이버는 추론모델을 오픈소스로도 공개할 계획이다. 경쟁력 있는 한국어 추론모델을 바탕으로 한국 AI 기술 생태계가 더욱 활성화될 것으로 기대된다. 네이버가 지난 4월 공개한 오픈소스 경량모델 'HyperCLOVA X SEED'는 한 달여 만에 50만 다운로드를 넘어서며 국내 오픈소스 AI 생태계 발전에 크게 기여한 바 있다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 두 가지 축으로 고도화하고 있으며, 하이퍼클로바X씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다"며 "기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 말했다.
김세형 기자 fax123@sportschosun.com