|
(울산=연합뉴스) 김용태 기자 = 인공지능(AI)에 한 유형의 데이터를 가르쳐 다른 유형의 데이터 학습을 촉진할 수 있는 기술을 울산과학기술원(UNIST) 연구진이 개발했다.
멀티모달 학습은 오디오, 이미지, 텍스트와 같이 서로 다른 데이터 유형(모달리티)을 결합해 통합적으로 이해하고 처리하는 학습법이다.
이 학습을 위해서는 고품질의 정렬된 데이터세트가 필요하다. 또 각 유형의 데이터가 정확하게 짝을 이루면서 학습이 이뤄지기 때문에 잘 매칭된 형태의 데이터가 있어야 한다. 명확히 짝지어진 데이터가 부족하면 성능이 저하되기도 한다.
윤 교수팀이 내놓은 학습법은 짝지어지지 않은 데이터로도 멀티모달 학습이 가능하다.
연구진은 텍스트 모델이 이미지 모델 학습을 돕거나 오디오 모델이 언어 모델 성능을 높일 수 있는지 확인하는 실험을 진행했다. 그 결과 기존보다 높은 정확도로 데이터 유형 간 학습 촉진 효과가 확인됐다.
특히 오디오와 이미지처럼 직접적인 연관성이 작은 조합에서도 AI의 성능 향상이 나타났다고 연구진은 설명했다.
연구진은 서로 다른 유형의 데이터 학습에서 꼭 필요하다고 여겨졌던 데이터 정렬 작업 없이도 학습이 가능해 데이터세트 구축 비용 등을 절감할 수 있을 것으로 기대한다.
윤성환 교수는 "정렬된 데이터세트 확보가 어려운 의료, 자율주행, 스마트 AI 비서 등 다양한 분야에서 활용 가능성이 높다"고 말했다.
이런 연구 결과는 세계 3대 인공지능 학회인 'ICLR(International Conference on Learning Representations) 2025'에서 발표됐다.
yongtae@yna.co.kr
<연합뉴스>