|
네이버가 추론(reasoning) 능력을 강화한 생성형 AI 'HyperCLOVA X THINK(하이퍼클로바X씽크)' 개발을 완료하고, 모델의 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트를 30일 발표했다.
추론모델은 '생각하는 힘'이 강화된 AI다. 사용자가 질의를 입력하면 모델이 혼잣말하듯이 길게 생각하며 답변 계획을 수립한다. 이 과정에서 복잡한 문제를 작은 단위로 나누는 능력, 적절한 도구나 함수를 선택하는 능력, 실수를 반추하고 교정하는 능력이 발현되며 생성 정보의 정확도와 유용성을 끌어 올린다.
'KoBALT-700' 벤치마크로 주요 LLM(거대언어모델)의 언어 능력을 측정한 결과, 유사 규모로 구축된 국내 주요 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 더 높은 점수를 기록했다. 해당 벤치마크는 서울대학교 언어학과에서 LLM의 깊이 있는 한국어 이해도를 진단하기 위해 설계됐으며, AI가 대화의 격률을 적절하게 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성됐다.
또 다른 대표적인 한국어 성능 평가 지표인 'HAERAE-Bench'에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다. 빠르게 대중화되고 있는 AI 에이전트 서비스에서 사용자와 모델 간 자유로운 언어적 상호작용의 중요성은 점점 커지는 만큼, 하이퍼클로바X씽크가 일상 속 다양한 상황네이버는 하이퍼클로바X씽크를 통해 AI가 언어뿐만 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했다. 테크니컬 리포트에 따르면 하이퍼클로바X씽크는 'STEM(Science, Technology, Engineering, Mathematics)' 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였다. 한국 대학수학능력시험 생명과학 문제에서, 그림으로 제시된 '생태계 천이 과정'과 '특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프'를 인식·분석하고 이를 양수림, 혼합림, 지의류 등에 대한 지식과 결합해 선택지 중 올바른 서술을 골라내는 식이다.
네이버는 추론모델을 오픈소스로도 공개할 계획이다. 경쟁력 있는 한국어 추론모델을 바탕으로 한국 AI 기술 생태계가 더욱 활성화될 것으로 기대된다. 네이버가 지난 4월 공개한 오픈소스 경량모델 'HyperCLOVA X SEED'는 한 달여 만에 50만 다운로드를 넘어서며 국내 오픈소스 AI 생태계 발전에 크게 기여한 바 있다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 두 가지 축으로 고도화하고 있으며, 하이퍼클로바X씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다"며 "기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 말했다.
김세형 기자 fax123@sportschosun.com