"한계는 없다" 구글이 만든 최종병기 '알파고 제로'의 위력

기존 틀에서 벗어나 창의성까지 갖춘 '알파고 제로'가 탄생해 AI의 새로운 이정표를 제시했다.

알파고 제로는 교과서나 기보, 대결 상대가 없이 순수 독학으로 바둑을 익히고 바둑 고수들과 기존 알파고 버전을 압도하는 능력을 갖추게 됐다.

알파고제로6 — 딥마인드의 창업자인 데미스 허사비스 최고경영자(CEO) ⓒ 딥마인드

구글 자회사 딥마인드의 인공지능 바둑 프로그램 알파고는 지난해 3월 인간대표 이세돌 구단을 4대 1로 꺽어 전 세계에 충격을 안겼다.

올해 5월에도 세계 최강 중국의 커제 9단마저 정식 대국에서 알파고에 3대 0으로 무릎 꿇은 뒤 눈물을 흘렸다.

딥마인드는 이세돌 9단과 겨룬 AI를 '알파고 리(Lee)', 보다 발전해 커제 9단을 격파한 버전을 '알파고 마스터( Master)'로 불렀다.

인간이 만든 정석을 외우거나 기보를 통해 바둑을 학습한 것이 이 두 가지 알파고의 공통점이다.

하지만 딥마인드는 여기서 더 나아가 무(無)의 상태에서 스스로 바둑을 깨우친 '알파고 제로'를 개발했다.

딥마인드의 창업자인 데미스 허사비스 최고경영자(CEO)와 이 회사 소속 연구원 17명은 19일 (한국시간) 알파고 제로의 개발 과정을 담은 논문 '인간 지식 없이 바둑을 마스터하기'(Mastering the game of Go without human knowledge)라는 논문을 과학 학술지 '네이처'에 발표했다.

알파고 제로는 바둑 규칙 이외에는 아무런 사전 지식이 없는 상태의 신경망에서 출발한다.

바둑판만 놓고 '셀프 바둑'을 두면서 스스로 바둑의 이치를 터득하는 것이다.

승률을 높이는 좋은 수 가 어떤 것인지 데이터를 쌓으면서 알파고 제로가 바둑을 이해하는 수준은 점점 높아진다.

이 학습 방식은 생물이 뇌에서 실제로 작동하는 '강화 학습'과 비슷하다.

개에게 먹이를 주면서 '앉아'등 특정 행동을 훈련시키는 것과 같다.

이세돌 9단과 4대 1로 이긴 '알파고 리' 버전과 비교해 보면 알파고 제로는 독한 36시간만에 이 버전의 실력을 넘어섰다.

40일간 2,900만판을 둔 뒤에는 기존 최강 '알파고 마스터'와의 대국에서 89승 11패를 거두며 압도적 우위를 차지하기도 했다.

논문은 알파고 제로의 능력에 대해 "인간이 가진 지식의 한계에 구속되지 않기 때문에 더 강력해졌다"라고 설명했다.

데미스 허사비스(CEO)는 우리 프로그램 중 가장 강력한 버전인 '알파고 제로'는 사람들이 만든 데이터를 입력하지 않아도 될 뿐 아니라 컴퓨터 파워도 덜 든다" 며 "불과 2년만에 알파고가 얼마나 멀리 왔는지 보면 놀라울 따름"이라고 밝혔다.

이에 전문가들은 앞으로 AI의 한계는 없을 것으로 보인다며 인간 전문가가 존재하지 않는 접근조차 불가능한 새로운 영역에서 AI가 더욱 빛을 발할 것이라 전망했다.