Advertisement
사진, 음성, 텍스트 등 서로 다른 형태의 정보를 동시에 받아 의미를 파악하는 '멀티모달 AI'가 바로 그것이다.
Advertisement
27일 정보통신기술(ICT) 업계에 따르면 이처럼 이미지나 음성 등을 인식해 처리할 수 있는 멀티모달 인공지능(AI)이 주목받고 있다.
Advertisement
기존 AI 모델은 일상어를 이해하는 자연어 분석(NLP)이 전제돼야만 추론을 할 수 있다고 봤다.
Advertisement
예컨대 멀티모달 AI는 풍경 사진을 입력받아 해당 장소에 대한 요약을 생성할 수 있고, 이러한 설명을 기반으로 이미지를 생성할 수 있다.
멀티모달 AI는 텍스트로만 설명할 수 없는 실제 장면과 감정적 맥락을 사진, 소리, 움직임 등 비언어적 정보를 이용해 해석할 수 있기 때문이다.
최근 멀티모달 AI는 문서 기반 비정형 데이터 처리에 효과적으로 사용되고 있다.
문자를 추출하는 광학문자판독(OCR)을 넘어서 레이아웃 구조, 표, 차트, 문맥적 의미를 동시에 파악하는 데 멀티모달 AI가 쓰이는 것이다.
멀티모달 OCR을 적용하면 한글 문서, 표, 그래프를 이해할 수 있고, 이를 요약하거나 자원관리시스템(ERP)과 연동하는 작업까지 수행할 수 있다.
아울러 자율주행, 스마트 로봇에도 멀티모달 AI가 쓰일 수 있다.
카메라, 위치정보시스템(GPS), 관성 측정 장치(IMU) 등 다양한 센서 데이터를 결합해 돌발 상황을 즉각 반응할 수 있도록 하는 기능은 멀티모달 학습을 통해 가능하기 때문이다.
생성형 AI와 챗봇도 대표적인 멀티모달 AI의 사용처다.
멀티모달 AI를 활용하면 이용자는 일상어로 물어보고 AI는 이미지로 대답하는 등 다양한 용법을 활용할 수 있기 때문이다.
업계 관계자는 "멀티모달 AI는 다양한 유형의 데이터를 통합해 더 많은 맥락을 파악하고 모호성을 줄일 수 있다"라며 "멀티모달 AI 시스템은 잡음과 누락된 데이터에 대한 복원력이 뛰어나다"라고 평가했다.
built@yna.co.kr
연예 많이본뉴스
-
'혼전동거' 신지♥문원, 신혼집에 날벼락..CCTV에 찍힌 난장판 "옆집까지 난리" -
'흑백' 김희은, 금수저라더니...'반전' 원룸살이→면봉 재활용 '짠내 일상' -
현주엽, 갑질 논란 후 충격적 근황 "子폐쇄 병동에 세 번째 입원, 정신과 약 먹으며 치료中" -
'성매매 합법화 주장' 김동완, 5일 만 입 열었다 "하고싶은 말 했을 뿐" -
민희진에 뉴진스는 어떤 존재?…한달전 부모 탓하더니, 멤버 위해 256억 포기?[SC이슈] -
유상무, 대장암 3기 수술 9년…♥아내 뭉클한 축하 "완치남 고마워" -
옥택연, ♥4살 연하 연인과 4월24일 결혼 확정…2PM 두 번째 품절남 -
'친모 절연' 장윤정, 47세에 받은 父 첫 인정 "이제 노래 좀 들을만 하다"
스포츠 많이본뉴스
- 1.김민재(첼시, 29) 깜짝 이적! '단돈 500억' 런던행 비행기 탄다→뮌헨, 파격 세일 단행…토트넘도 '영입 기회 포착'
- 2.'캡틴' 손흥민 45분 교체, 1차전 '1골 3도움' 결정적...LA FC 챔피언스컵 16강 진출, 에스파냐전 합계 스코어 7대1 완벽 제압
- 3.'대박' 손흥민 LA FC서도 캡틴 달았다!...흥부 듀오 조용했던 45분, 에스파냐전 0-0(전반 종료)
- 4.도박 파문 때문에? 김태형 롯데 감독, 얼굴이 반쪽이 됐다 → "부모님들은 얼마나 속상하시겠나" [미야자키 현장]
- 5.'혜성이 이제 좀 치네!' 로버츠 감독의 선구안 칭찬…다저스 2루수 '주전 청신호'→"약점 많이 메웠다"