인공지능 바둑 프로그램 '알파고'를 뛰어넘는 새로운 버전의 '알파고 제로'가 등장했다.
논문을 보면, 알파고 제로는 바둑 규칙 외에는 아무런 사전 지식이 없는 상태의 신경망에서 출발한 게 기존 알파고 프로그램과 다르다. 바둑판을 놓고 '셀프 바둑'을 두면서 바둑의 이치를 터득했다.
스스로 승률을 높이는 수가 어떤 것인지 깨닫고 관련 데이터를 축적하면서 실력을 키웠다.
실제 지난해 3월 이세돌 9단을 4대1로 이긴 버전('알파고 리'로 지칭)과 비교할 때 알파고 제로는 독학 36시간 만에 알파고 리 버전의 실력을 넘어섰다. 또 알파고 제로가 72시간 독학을 한 후 '이세돌 9단 대 알파고 리' 실전 당시와 똑같은 대국 조건(제한시간 2시간씩)에서 알파고 리와 대결한 결과 100전 100승 무패를 기록했다. 알파고 제로가 한 수에 0.4초가 걸리는 '초속기' 바둑으로 490만판을 혼자 두면서 연구한 결과다.
알파고 제로가 40일에 걸쳐 2,900만판을 혼자 둔 후에는 올해 5월 현 세계랭킹 1위 커제 9단을 3대0으로 꺾었던 기존 최강 버전 '알파고 마스터'의 실력마저 압도하게 됐다. 알파고 제로는 알파고 마스터에 100전 89승 11패를 거뒀다. 알파고 제로는 바둑의 기본 규칙만 아는 상태로 혼자 바둑을 두는 강화학습에 따른 독학 과정에서 인간이 알고 있는 정석을 스스로 깨달았을 뿐만 아니라 독특한 정석을 개발하기도 했다는 게 구글 딥마인드 측의 설명이다. 이는 AI가 창의적인 생산물을 내놓을 수 있다는 점을 확인시켜줬다는 점에서 상당한 의미가 있다는 게 업계의 분석이다. <스포츠조선닷컴>