네이버까지 번진 독자 AI 논란…프롬 스크래치 기준 도마

(서울=연합뉴스) 강민지 기자 = 배경훈 부총리 겸 과학기술정보통신부 장관, 임문영 국가인공지능전략위원회 부위원장, 하정우 AI미래기획수석비서관 등이 30일 오후 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 기념촬영을 하고 있다. 2025.12.30 mjkang@yna.co.kr

(서울=연합뉴스) 강민지 기자 = 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 네이버클라우드 부스를 체험하고 있다. 2025.12.30 mjkang@yna.co.kr

인코더·가중치 활용 놓고 엇갈린 평가

소버린 AI 정책, 구체화 요구 커져

(서울=연합뉴스) 조성미 오지은 기자 = 해외 기술에 의존하지 않는 '소버린 인공지능(AI)'을 보유하겠다며 정부가 시작한 '독자 AI 파운데이션 모델' 프로젝트가 시작 초기부터 거센 자격 논쟁에 휩싸였다.

업스테이지가 중국 모델을 도용했다는 주장이 나왔다가 주장을 제기한 측이 "검증이 엄밀하지 못했다"며 사과하고 일단락되는 듯했으나 이번에는 네이버가 멀티모달AI 모델의 '두뇌'에 해당하는 기능을 중국 모델에서 갖다 썼다는 논란이 불거졌다.

이 프로젝트를 통해 소버린 AI를 갖추겠다는 정부가 기초부터 자체적으로 개발하는 '프롬 스크래치' 방식을 평가 요소로 제시하고도 어디부터가 진짜 프롬 스크래치인지 확실히 규정하지 않아 논란을 키웠다는 지적도 제기된다.

◇ 네이버 "기술 판단 따른 것" 해명에도 꺼지지 않는 논란

6일 정보통신기술(ICT) 업계에 따르면 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치) 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다.

하이퍼클로바X와 큐웬 2.4 언어모델의 코사인 유사도와 피어슨 상관계수가 높아 비전 인코더와 가중치(웨이트)를 사용한 것으로 해석됐다.

네이버클라우드는 중국 오픈소스를 가져다 쓴 점에 대해 인정한다며 "이번 모델에서 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"라는 해명을 내놨다.

네이버클라우드는 "이는 기술적 자립도가 부족해서가 아니라 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 엔지니어링 판단에 해당한다"라고 했다.

이런 네이버 측 설명이 알려지자 AI 개발자 커뮤니티 일각에서는 반론이 제기되는 중이다.

시각·청각 등 다양한 정보를 처리하는 멀티모달AI의 핵심 기능과 연결되는 비전 인코더를 큐원에서 차용한 점과 단순 데이터셋이 아닌 가중치까지 활용된 점이 의아하다는 반응이다.

네이버클라우드는 "비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하며 네이버는 VUClip과 같은 독자적인 비전 기술력을 보유하고 있다"라고 설명했다.

이에 AI 개발자들은 네이버 측이 인코더의 역할을 축소해서 평가하고 있다고 지적했다. 비전 인코더와 가중치는 시각 정보를 모델이 이해할 수 있는 단순한 신호뿐만 아니라 의미로 변환하는 '두뇌'와 같은 장치기 때문이다.

한 AI 업계 관계자는 "인코더에 대해 이미지를 숫자로 바꿔주는 간단한 필터 정도로 오해하기 쉽지만 AI 모델 성능을 좌우하는 매우 중요한 부분"이라며 "전체 파라미터에서 10%가 넘는 비중이 인코더가 차지하는 경우도 있는 만큼 성능과 직결된다"고 말했다.

반면, 인코더가 알고리즘의 일부분일 뿐이어서 프롬 스크래치 기조의 대세에는 지장이 없다는 관점도 분명히 존재한다.

최병호 고려대 AI 연구소 교수는 "인코더는 알고리즘 중 하나기 때문에 역할이 극히 일부분에 지나지 않는다"며 "설사 베꼈다고 하더라도 다른 것으로 언제든지 바꿀 수 있어 모델 전체가 문제가 있다고 보긴 어렵다"고 말했다.

◇ 오픈소스 쓰다 막히면?…소버린 AI 기준 어디까지

네이버클라우드 모델이 중국 큐원의 인코더와 가중치를 사용한 것이 AI 개발업계에서 논란이 되는 가장 큰 이유는 오픈소스로 제공했던 큐원 측이 사용 허가를 거둘 경우 해당 모델을 계속 유지할 수 있는지다.

정부가 독자 AI 파운데이션 모델을 개발한 취지도 미·중 빅테크가 AI 파운데이션 모델의 사용료를 급격하게 올리거나 갑자기 사용 허가(라이센스)를 취소할 경우 야기될 수 있는 문제를 대비하자는 것이었다.

비용 문제뿐 아니라 국방, 의료 등 AI가 국가 명운이 달린 부분까지 관장하게 될 상황을 대비해 독자적인 기술력을 확보하자는 의미에서였다.

과학기술정보통신부는 독자 AI 모델 프로젝트를 시작하면서 "해외 모델 미세조정(파인튜닝) 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델"이라며 "타사 모델에 대한 라이센싱 문제가 없을 것"을 조건으로 내건 바 있다.

지난해 8월 5개 정예팀을 뽑았을 때도 "정예팀들은 모두 수준 높은 AI 모델 개발 역량을 보유한 것으로 증명됐으며 처음부터(프롬 스크래치) 시작해 소버린 AI의 본질을 지향한 것으로 평가된다"고 밝혔다.

◇ "프롬 스크래치 기준 구체화해야"…정부, 입장 밝힐까

정부가 독자 AI 모델의 방향성을 제시하고도 층위가 다양한 AI 모델 개발에서 어떤 수준부터 프롬 스크래치인지 모호한 입장을 유지한 것이 최근의 논란을 낳았다는 분석도 있다.

정부가 구체적인 지침을 내놓지 않고 있는 사이 AI 업계에서 자체적인 기준 정립이 논의되기 시작했다.

이승현 포티투마루 부사장은 최근 깃허브에 올린 게시물에서 "우리는 소모적인 논쟁을 넘어 '무엇이 진정한 기술 주권인가'에 대한 명확한 기준을 정립해야 한다"고 촉구했다.

그는 AI 모델의 주권 수준을 판별하는 '7단계 등급 체계'를 제안하고 "이 기준은 단순한 성능 평가가 아닌 데이터의 기원과 통제권, 구조 및 코드의 수정 권한, 국가 안보적 가치와 인프라 자립도로 구성된다"고 설명했다.

이 부사장은 주권·통제 수준이 없는 빅테크 모델 API 호출인 0단계부터 국가 안보가 보장되는 6단계까지 나눴다.

그는 4단계부터 AI에 대한 통제권이 확보된다며 이 단계는 해외 모델 구조를 참조하되 가중치는 100% 자체 학습을 해야 한다고 기술했다.

AI 업계 관계자는 "프롬 스크래치 논란이 커지는데 정부가 묵묵부답으로 있는 것은 논란을 확산시킬 것"이라고 우려했다.

csm@yna.co.kr

연예 많이본뉴스

스포츠 많이본뉴스