엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터 'FoCus Dataset(포커스 데이터셋·For Customized conversation dataset)'을 공개했다고 14일 밝혔다.
'FoCus Dataset'은 사용자 개인의 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 약 8000여개의 광범위한 주제를 다룬 1만 5000개 이상의 대화로 구성된다. 'FoCus Dataset'을 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다고 엔씨소프트는 전했다.
또 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다. 현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용이 소요됨에도 불구하고, 실시간 지식과 개인의 경험을 반영하는데 한계를 나타내고 있는 것으로 알려졌다.
공동연구팀은 지난 2월 세계 최고 권위의 인공지능 학회 'AAAI 2022'에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회를 비롯한 연구 성과를 공유하는 워크샵을 고려대와 공동 개최한다.
엔씨소프트 이연수 언어 AI Lab 실장은 "최근 NLP 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정하였으며, 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이루어지기를 기대한다"고 설명했다.
남정석 기자 bluesky@sportschosun.com
-
"아이유, 커피 선결제 해줘"…투표용지 사태에 난데없는 SNS 댓글 테러 -
'공황장애 고백' 김신영, 故전유성 생각에 오열.."삶엔 기쁨·슬픔 다 있다며 위로" ('유퀴즈') -
“제가 강도범 아니라..” 서동주, 김규리 자택 강도 사건 관련 오해 직접 해명 [SC이슈] [전문] -
31기 순자, 착장 가격만 1500만원 ‘명품’ 패션..누리꾼들 ‘와글와글’ -
유산 받으려 아버지 살해한 아들..가축 매립지에 시신 유기까지 -
"AI 아니고 실화라고?" 젠슨 황, 3차 노래방 대신 '유퀴즈'서 K팝 댄스 -
'논현맘' 백지영, 딸 '200만원' 댄스 학원 보낸 보람 있네.."쇼케이스 무대 선다" -
"자궁 파열·대량 출혈 위험"…김동현, 고위험군 '넷째 출산'에 쏟아지는 불안
- 1.드디어 터졌다! '162㎞ 광속구+10탈삼진' 사사키 인생투 폭발...7이닝 무실점 3점대 ERA 눈앞
- 2."잊지 못할 생일 됐다" 감격한 KIA 박민, 오러클린 침몰시킨 투런포의 '비밀' [광주피플]
- 3.'강인아 너에게도 몰릴거야' 日 국대 구보 다케후사, 멕시코 몬테레이 월드컵 캠프 최고 인기남!..유창한 스페인어로 해외 미디어에 척척 대응
- 4."내가 5월 수비상? 요즘 좀 아쉬운데…" 사이클링히트 자진 포기 → 커리어하이! 삼성 박승규가 달라진 비결 [인터뷰]
- 5.오늘은 김태형 감독 800승 나오나…롯데, 투수 엔트리 변경 [부산 현장]