네이버가 하이퍼클로바의 딥러닝 기술을 음성인식 AI 엔진에도 접목해 성능을 대폭 강화했다고 8일 밝혔다. 네이버는 클로바노트, 클로바 케어콜 등 음성인식 AI를 활용한 여러 서비스에 업그레이드된 엔진을 탑재해 더욱 편리한 사용자 경험을 제공할 예정이다.
전통적으로 AI 딥러닝은 데이터와 데이터를 설명하는 레이블(label)을 쌍으로 학습시키는 '지도학습(supervised learning)' 방식으로 이뤄져왔다.
음성인식 AI를 개발하기 위해서는, 음성과 음성 속 텍스트를 같이 학습시켜야 한다. 이 같은 데이터 레이블링은 사람의 수작업으로 이뤄지기 때문에 학습데이터 구축에 시간과 비용이 많이 든다. 반면 자기지도학습(self-supervised learning)은 레이블 없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법으로 학습의 효율성을 훨씬 높일 수 있다. 이는 네이버가 최근 공개한 초대규모(hyperscale) AI '하이퍼클로바'의 핵심 기술이기도 하다.
네이버는 자기지도학습 기법을 AI 음성인식 엔진 'NEST(Neural End-to-end Speech Transcriber)'에도 적용함으로써, 기존 대비 음성인식의 정확도를 약 30% 높였다. 새로운 학습기법 적용으로 음원 데이터 속 텍스트를 확인하는 전사(transcription) 작업을 최소화하면서도 기존보다 정확한 AI 학습이 가능해진만큼 모델의 학습 시간 및 비용도 획기적으로 단축됐다. NEST 엔진은 단문 위주의 음성 명령보다 복잡한 장문의 음성 표현을 인식하는데 최적화된 기술로, 네이버가 2020년 4월 처음 공개했다.
업그레이드된 NEST 엔진은 '클로바노트'에 탑재됐다. 네이버가 작년 말 출시한 음성기록 서비스 클로바노트는 높은 인식률과 편리한 서비스로 사용자들의 호응을 얻으며, 올해 1월 대비 지난 달 사용자 수(MAU)가 2.5배나 증가하는 등 빠른 성장세를 보이고 있다. 최근에는 누적 앱 다운로드가 40만 건을 돌파하기도 했다. 네이버는 클로바노트를 시작으로, AI가 전화로 코로나19 능동감시자를 확인하는 클로바 케어콜, 뉴스 자동 자막 서비스 등 음성인식 AI가 적용된 여러 서비스로 점차 적용을 확대할 예정이다.
네이버 관계자는 "음성 AI 분야 양대 국제 학회인 'Interspeech'와 'ICASSP'에 올해 각각 9개씩의 논문이 채택되는 등 국내를 넘어 글로벌 최고 수준의 음성기술 경쟁력을 이미 인정받고 있다"며 "하이퍼클로바의 기술을 접목시킴으로써, 다양한 음성 AI 서비스의 성능을 더욱 고도화해나갈 것"이라고 말했다.
김세형 기자 fax123@sportschosun.com
-
이선희, 40년 만에 '파격 변신' 감행한 진짜 이유…"그냥 이거대로 살자 싶었다" -
고우림 "김연아♥와 한 번도 안 싸워" 자랑하더니…강남 "혼난 적 있잖아" 폭로 -
'중식여신' 박은영, 신라호텔 결혼식 현장 포착…'하석진 닮은' 의사 남편 최초 공개 -
홍진경, 이혼 후 전남편·딸과 '셋이 냉면 외식'…식당 직원들도 '당황'(소라와진경) -
블랙핑크 리사, SNS 게시물 하나에 '9억'인데…손에 든 건 '2000원 다이소 컵' -
'마약 해명·저격 잡음' 박봄까지 다 뭉쳤다…2NE1, 불화설 깬 감격의 '17주년 자축' -
차현승, 보미♥라도 결혼식서 '백혈병 완치' 축하 받았다…"해주러 갔다 더 많이 받아" -
박찬욱 감독, 프랑스 최고 훈장 '코망되르' 수훈...칸 심사위원장 겹경사
- 1."손흥민, 이강인, 김민재" 韓 축구 명단만 봐도 '벌벌'...'다크호스' 체코 벌써 긴장했다, "한국 정말 만만치 않아"→팬들 "우린 3위나 해야 돼"
- 2.이럴수가! 25점→9점→24점. 126년 동안 최다기록. 3경기에 58득점이라니...
- 3.멘털 나갔나? 롯데 수비 얼마나 끔찍했길래.. → 외국인투수 갑자기 웃어버렸다
- 4.[속보]北 내고향여자축구단 중국 통해 입국,北선수단 2018년 이후 7년만의 방한...20일 오후 7시 수원FC위민과 준결승[亞여자챔피언스리그]
- 5.'또 127년 역사상 최초' 510억 헐값, 美 왜 경악했나…"ML 전체 영입 발 뺐다고? 미친 짓이다"