Advertisement
(서울=연합뉴스) 조성미 오지은 기자 = 해외 기술에 의존하지 않는 '소버린 인공지능(AI)'을 보유하겠다며 정부가 시작한 '독자 AI 파운데이션 모델' 프로젝트가 시작 초기부터 거센 자격 논쟁에 휩싸였다.
Advertisement
이 프로젝트를 통해 소버린 AI를 갖추겠다는 정부가 기초부터 자체적으로 개발하는 '프롬 스크래치' 방식을 평가 요소로 제시하고도 어디부터가 진짜 프롬 스크래치인지 확실히 규정하지 않아 논란을 키웠다는 지적도 제기된다.
Advertisement
6일 정보통신기술(ICT) 업계에 따르면 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치) 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다.
Advertisement
네이버클라우드는 중국 오픈소스를 가져다 쓴 점에 대해 인정한다며 "이번 모델에서 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"라는 해명을 내놨다.
이런 네이버 측 설명이 알려지자 AI 개발자 커뮤니티 일각에서는 반론이 제기되는 중이다.
시각·청각 등 다양한 정보를 처리하는 멀티모달AI의 핵심 기능과 연결되는 비전 인코더를 큐원에서 차용한 점과 단순 데이터셋이 아닌 가중치까지 활용된 점이 의아하다는 반응이다.
네이버클라우드는 "비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하며 네이버는 VUClip과 같은 독자적인 비전 기술력을 보유하고 있다"라고 설명했다.
이에 AI 개발자들은 네이버 측이 인코더의 역할을 축소해서 평가하고 있다고 지적했다. 비전 인코더와 가중치는 시각 정보를 모델이 이해할 수 있는 단순한 신호뿐만 아니라 의미로 변환하는 '두뇌'와 같은 장치기 때문이다.
한 AI 업계 관계자는 "인코더에 대해 이미지를 숫자로 바꿔주는 간단한 필터 정도로 오해하기 쉽지만 AI 모델 성능을 좌우하는 매우 중요한 부분"이라며 "전체 파라미터에서 10%가 넘는 비중이 인코더가 차지하는 경우도 있는 만큼 성능과 직결된다"고 말했다.
반면, 인코더가 알고리즘의 일부분일 뿐이어서 프롬 스크래치 기조의 대세에는 지장이 없다는 관점도 분명히 존재한다.
최병호 고려대 AI 연구소 교수는 "인코더는 알고리즘 중 하나기 때문에 역할이 극히 일부분에 지나지 않는다"며 "설사 베꼈다고 하더라도 다른 것으로 언제든지 바꿀 수 있어 모델 전체가 문제가 있다고 보긴 어렵다"고 말했다.
◇ 오픈소스 쓰다 막히면?…소버린 AI 기준 어디까지
네이버클라우드 모델이 중국 큐원의 인코더와 가중치를 사용한 것이 AI 개발업계에서 논란이 되는 가장 큰 이유는 오픈소스로 제공했던 큐원 측이 사용 허가를 거둘 경우 해당 모델을 계속 유지할 수 있는지다.
정부가 독자 AI 파운데이션 모델을 개발한 취지도 미·중 빅테크가 AI 파운데이션 모델의 사용료를 급격하게 올리거나 갑자기 사용 허가(라이센스)를 취소할 경우 야기될 수 있는 문제를 대비하자는 것이었다.
비용 문제뿐 아니라 국방, 의료 등 AI가 국가 명운이 달린 부분까지 관장하게 될 상황을 대비해 독자적인 기술력을 확보하자는 의미에서였다.
과학기술정보통신부는 독자 AI 모델 프로젝트를 시작하면서 "해외 모델 미세조정(파인튜닝) 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델"이라며 "타사 모델에 대한 라이센싱 문제가 없을 것"을 조건으로 내건 바 있다.
지난해 8월 5개 정예팀을 뽑았을 때도 "정예팀들은 모두 수준 높은 AI 모델 개발 역량을 보유한 것으로 증명됐으며 처음부터(프롬 스크래치) 시작해 소버린 AI의 본질을 지향한 것으로 평가된다"고 밝혔다.
◇ "프롬 스크래치 기준 구체화해야"…정부, 입장 밝힐까
정부가 독자 AI 모델의 방향성을 제시하고도 층위가 다양한 AI 모델 개발에서 어떤 수준부터 프롬 스크래치인지 모호한 입장을 유지한 것이 최근의 논란을 낳았다는 분석도 있다.
정부가 구체적인 지침을 내놓지 않고 있는 사이 AI 업계에서 자체적인 기준 정립이 논의되기 시작했다.
이승현 포티투마루 부사장은 최근 깃허브에 올린 게시물에서 "우리는 소모적인 논쟁을 넘어 '무엇이 진정한 기술 주권인가'에 대한 명확한 기준을 정립해야 한다"고 촉구했다.
그는 AI 모델의 주권 수준을 판별하는 '7단계 등급 체계'를 제안하고 "이 기준은 단순한 성능 평가가 아닌 데이터의 기원과 통제권, 구조 및 코드의 수정 권한, 국가 안보적 가치와 인프라 자립도로 구성된다"고 설명했다.
이 부사장은 주권·통제 수준이 없는 빅테크 모델 API 호출인 0단계부터 국가 안보가 보장되는 6단계까지 나눴다.
그는 4단계부터 AI에 대한 통제권이 확보된다며 이 단계는 해외 모델 구조를 참조하되 가중치는 100% 자체 학습을 해야 한다고 기술했다.
AI 업계 관계자는 "프롬 스크래치 논란이 커지는데 정부가 묵묵부답으로 있는 것은 논란을 확산시킬 것"이라고 우려했다.
csm@yna.co.kr
연예 많이본뉴스
-
'혼전동거' 신지♥문원, 신혼집에 날벼락..CCTV에 찍힌 난장판 "옆집까지 난리" -
'흑백' 김희은, 금수저라더니...'반전' 원룸살이→면봉 재활용 '짠내 일상' -
현주엽, 갑질 논란 후 충격적 근황 "子폐쇄 병동에 세 번째 입원, 정신과 약 먹으며 치료中" -
'성매매 합법화 주장' 김동완, 5일 만 입 열었다 "하고싶은 말 했을 뿐" -
민희진에 뉴진스는 어떤 존재?…한달전 부모 탓하더니, 멤버 위해 256억 포기?[SC이슈] -
유상무, 대장암 3기 수술 9년…♥아내 뭉클한 축하 "완치남 고마워" -
옥택연, ♥4살 연하 연인과 4월24일 결혼 확정…2PM 두 번째 품절남 -
'친모 절연' 장윤정, 47세에 받은 父 첫 인정 "이제 노래 좀 들을만 하다"
스포츠 많이본뉴스
- 1.김민재(첼시, 29) 깜짝 이적! '단돈 500억' 런던행 비행기 탄다→뮌헨, 파격 세일 단행…토트넘도 '영입 기회 포착'
- 2.'캡틴' 손흥민 45분 교체, 1차전 '1골 3도움' 결정적...LA FC 챔피언스컵 16강 진출, 에스파냐전 합계 스코어 7대1 완벽 제압
- 3.'대박' 손흥민 LA FC서도 캡틴 달았다!...흥부 듀오 조용했던 45분, 에스파냐전 0-0(전반 종료)
- 4.도박 파문 때문에? 김태형 롯데 감독, 얼굴이 반쪽이 됐다 → "부모님들은 얼마나 속상하시겠나" [미야자키 현장]
- 5.'혜성이 이제 좀 치네!' 로버츠 감독의 선구안 칭찬…다저스 2루수 '주전 청신호'→"약점 많이 메웠다"