(광주=연합뉴스) 장아름 기자 = 한국에너지공과대학교(KENTECH·켄텍)는 비전-언어 모델(Vision-Language Model)이 이미지의 본질적인 속성만 학습하도록 설계한 프롬프트 학습 기법을 개발했다고 13일 밝혔다.
클립(CLIP) 등 기존 비전-언어 모델은 이미지와 텍스트를 결합해 사물의 의미를 이해하지만, 세밀한 속성 구분이 필요한 상황에서는 한계가 있어 시각적 왜곡이 발생하기도 한다.
이석주 교수와 김가현·김소희 연구원이 참여한 연구팀은 이 문제를 해결하기 위해 '델타 메타 토큰(Delta Meta Token)'을 도입했다.
이 토큰은 이미지 간의 상대적 변화를 학습해 속성 차이를 정교하게 구분하도록 돕는다.
이를 통해 모델이 데이터 변화에 덜 민감하게 반응하면서도 의미 있는 속성만 학습해 시각적으로 유사한 대상도 구별할 수 있다.
기존 방식은 '강아지'라는 클래스 정보만 학습하지만 새로운 기법은 귀, 눈, 털 등 강아지의 공통된 속성을 함께 학습함으로써 강아지의 종류가 달라져도 본질적 속성을 인식하고 도메인이 다른 데이터에서 안정적인 성능을 유지한다.
제안된 기법은 사전 학습된 CLIP 모델에 최소한의 파라미터만 추가하는 경량 구조임에도 11개 벤치마크 데이터셋에서 기존 프롬프트 학습 방법을 능가하며 높은 일반화 성능을 보였다.
새로운 클래스나 도메인이 주어져도 안정적인 인식을 유지해 자율주행·로봇 비전·산업 영상 이상 검출 등 다양한 분야에 활용될 것으로 기대된다.
이 연구는 국제 학술지 'Pattern Recognition (Elsevier)'에 지난 달 23일 온라인으로 게재됐다.
areum@yna.co.kr
-
한그루 "이혼 후 다가오는 男 많아, 쉬워 보여 툭 던지더라" ('만리장성규') -
'81세' 임현식, 수척해진 얼굴에 걱정되는 건강…"병원 검사만 3개월 받아" -
'이혼 20년차' 유혜정, 전남편 서용빈·딸 데이트에 흐뭇.."멋진 아빠 돼줘 감사" -
한채아, 시父 차범근 똑닮은 딸 외모에 한숨 "크면 예뻐질 거라 했는데…" ('미우새') -
이준영, 7월 21일 군입대 깜짝 발표.."막상 날짜받으니 생각 많아져" [전문] -
아이유, 결혼식서 포착된 근황…'폭싹' 아역 김태연에 끝까지 챙긴 다정함 -
"무대서 점프하더니 털썩"..이홍기, 고통 호소하며 주저앉았다 -
'유산 아픔' 16기 옥순, 임신 의혹에 입 열었다..비키니 속 드러난 D라인에 "오해"
- 1."손흥민 대체 왜 그러는 거야!" 멕시코 팬들 폭발, '타코 휴식' 즐긴 쏘니 향한 깜짝 반응, 정체는 '애정 가득 관심' "더 맛있는 곳에서 먹지"
- 2."사과하고 싶습니다" 日 결국 눈물의 기자회견…모리야스 감독 "주장 엔도 이탈, 선수에게 끔찍한 일을 전한단 생각"
- 3.한국 여성 향한 충격 인종차별! 멕시코 무역단체 대표 결국 사임…"사람들 너무 예민해"→일부 누리꾼 반발 경악
- 4.'유럽 상대 2승1무' 북중미 휘감은 아시아 돌풍, 네덜란드 만날 日마저 이변 만드나
- 5.'긴급 병원 이송' 두산 어쩌나, 직접 교체 요청 심상치 않다…"15일 한번 더 검진 예정"