Last updated : 2021년 07월 27일

특집기사 세계최강 AI바둑프로그램은 누구이며 무엇이 다른가?

세계최강 AI바둑프로그램은 누구이며 무엇이 다른가 응씨배세계바둑대회를 창설한 대만의 재벌 응창기 선생은 2000년까지 프로기사를 이길 수 있는 컴퓨터 프로그램을 개발하는 이에게 […]
Written by : 관리자

세계최강 AI바둑프로그램은 누구이며 무엇이 다른가

응씨배세계바둑대회를 창설한 대만의 재벌 응창기 선생은 2000년까지 프로기사를 이길 수 있는 컴퓨터 프로그램을 개발하는 이에게 100만 달러의 상금을 주겠다고 약속했다. 이후 중국 톈진대학교수인 천즈싱(陳志行) 교수가 개발한 핸드토크(手談, HandTalk)라는 바둑프로그램이 한창 최강 바둑프로그램으로 인기를 끌면서 각종 컴퓨터바둑대회에서 우승을 휩쓸었으나 기력은 7~8급 수준에 머물렀다. 그렇게 바둑계에서는 사람을 이길 컴퓨터의 출현을 기대하는 것은 요원한 것으로 여겨졌다.

하지만 2000년을 훌쩍 넘긴 2016년 이세돌 9단과 알파고의 ‘세기의 대결’이 성사되면서 세계바둑계는 역사적인 상황을 맞았다. 알파고와의 대결을 앞둔 이세돌 9단 조차도 유럽챔피언과의 기보를 보고도 승부 예측을 묻는 질문에 5-0 혹은 본인이 실수로 한판을 지는 것까지 고려해서 4-1로 자신이 승리할 것이라고 웃으면서 장담했다. 아직은 멀었다는 뜻이다. 바둑계는 앞으로 인공지능이 프로기사를 이기려면 10년은 더 걸릴 것이라고 판단했으며, AI는 창의력과 직관능력을 기반으로 하는 인간의 감각을 뛰어넘을 수 없을 것이라고 여겼다. 하지만 대국 결과는 이세돌 9단이 1-4로 완패했으며, 바둑계는 AI 출현으로 패닉 상태에 빠졌다.

이후 알파고가 은퇴를 하고, 더욱 강력한 바둑프로그램이 속속 출현하면서 인간은 인공지능을 바둑 스승으로 모시는 상황이 됐다. TV바둑해설에서도 ‘바둑의 신’이라는 프로 9단들의 해설보다 인공지능의 참고도를 더 신뢰하게 됐다.

이런 상황에서 ‘최강의 AI는 누구일까’에 관심이 쏠린다. 가장 최근에 끝난 대회는 지난해 9월~12월에 열린 2020세계인공지능바둑대회 상위 성적 프로그램을 살펴볼 필요가 있다. 세계최강 중 하나로 꼽힌 ‘절예(絶藝)’가 불참한 가운데 5개국 20개 팀이 출전해 최종 머틀고(MyrtleGo,采薇), 이지스고(izisGo,隱智), 톈고(TianGo,天狗), 이러고(Yilego), 차오란고(ChaoRanGo), 릴라제로(leela zero), 골락시(GOLAXY, 星阵), 돌바람 등 이 결선에 올랐다. 치열한 접전 끝에 최종 결승전에서 골락시가 머틀고에게 4-0으로 완승을 거두며 우승을 차지했다. 디팬딩 챔피언 골락시는 예선전에서 5승 2패로 머틀고와 차오란고에 이어 3위로 결선에 진출했다. 골락시는 결선8강, 4강에서 돌바람과 릴라제로를 각각 2-0, 3-0으로 물리쳤으며, 최종 결승전에서 머틀고에게 4-0으로 승리를 거두어 9전 전승으로 우승을 차지했다.

성적만으로 볼 때 골락시는 월등했다. 골락시는 비공식대결에서 최강자로 알려졌던 텐센트의 ‘절예’를 6-2로 꺾은 바 있어 사실상 현존 최강자인 셈이다. 2018년 4월 12일 정식으로 모습을 드러낸 골락시는 칭화대학(清华大学)이 개발했던 ‘신산자(神算子)’의 업그레이드 버전이다. 골락시는 정선으로 박정환, 최철한, 커제, 판팅위, 저우루이양 등 세계정상급 선수들과 대국을 벌여 40승 1패를 기록했다.

골락시는 칭화대와 선커과기(深客科技)가 공동 개발한 것으로 알파고와는 전혀 다른 구조로 이루어졌다. 선커과기 진싱(金涬) CEO는 ”골락시는 알파고Zero 논문을 재현한 것이 아니며, 알파고의 기본 구조를 참고로 하여 특징 체계, 모델링 구조, 몬테카를로(MCTS) 알고리즘 등 여러 측면에서 혁신적 변화를 주어 알파고 아키텍처의 기술이 진화한 것으로 볼 수 있다"고 말했다. 골락시의 장점은 기존 AI와 달리 우세한 상황에서도 물러나지 않고 최선의 수로 응수한다는 점이다. 또한 임의로 덤이나 바둑판 규격을 설정하여 대국도 가능하여 알파고를 비롯하여 기존 AI의 영역을 뛰어 넘어 더욱 실용성을 갖췄다.

이에 프로기사들도 과거 알파고제로의 바둑은 인간이 봐도 이해가 안되어 마치 미래에서 온 수(手)라는 느낌이었는데 골락시가 두는 수는 인간이 이해하기에 훨씬 현실적이라는 느낌이라는 평가를 받고 있다. 이와 관련해 이번 대회에 참가한 골락시 관계자는 “골락시는 처음으로 승률과 집수를 서로 결합한 알고리즘을 사용했는데 이런 방법은 단순하게 승리에 집중한 것이 아니라서 인간의 사고에 훨씬 가까운 알고리즘이다. 그래서 골락시가 두는 바둑은 인간이 더 쉽게 이해할 수 있고 감상할 수 있는 것이다”라고 설명했다.

준우승자인 머틀고는 이번이 AI대회 첫 참가였다. 머틀고는 오픈 소스를 참고하지 않았다. 자체 개발한 고성능의 검색엔진을 통해 GPU의 리소스를 충분히 이용할 수 있다. 개발자는 오픈소스를 참고하지않은 이유에 대해서 “저 스스로의 흥미때문이다. 또다른 이유는 오픈소스는 약간 기술적 발전이라는 점에 있어서 결코 좋은 것은 아니다(계속 의존하게 됨)”고 설명했다.

예선에서 9위로 본선진출에 실패했지만 접바둑이 뛰어난 것으로 알려진 카타고(Katago)는 바둑에 특화된 신경망 설계와 개선된 학습 능력을 갖췄으며, 일본 규칙과 덤 설정이 자유롭다는 평가받는다. 또한 예상 승률과 예상 집 차이 결과를 보여주고 수상전에 강하며, 자가학습 능력이 릴라제로나엘프고에 비해 빨라 일반인들이 많이 선호한다.

지난해 푸저우(福州)에서 열린 세계인공지능바둑대회는 정규화 되지않는 운영미숙으로 시간패 등 불미스러운 일들이 있었지만 이번 대회를 통해 규칙도 좀더 합리적으로 개선됐고, 플랫폼도 갈수록 안정되어 성숙해졌다는 평가를 받았다. 그 가운데 눈에 띄는 특징은 덤 제도다. 그동안 수 차례의 인공지능세계바둑대회의 흑백 승률 통계를 보면 덤 7.5집(3과3/4子)인 경우 백이 아주 유리해 흑의 승률은 40% 내외에 그쳤다. 이를 바탕으로 이번 대회에서 덤 6.5집(3과1/4子=3.25)을 적용하는 대신 마지막 공배를 흑이 메우게 되면 덤 1/2子(0.5)를 추가로 줘야한다고 명시했다. 즉, 덤이 3과1/4인 경우는 백이 마지막 공배를 메워 흑백이 똑같이 착수한 돌의 개수가 같은 경우이고, 흑이 마지막 공배를 메워 한수를 더 놓게 되면 그 한 수에 대해서 반반씩 권한을 나눠 가져야 함으로 덤 0.5를 추가로 줘서 3.75(3과3/4자)를 준다는 것이다. 이런 규정을 둠으로써 중국 규칙 기초하에 흑 덤6.5집 제도를 구현했다. 그 결과 예선에서 흑의 승률은 55%(39승 31패), 결선에서는 50%(10승 10패)를 기록했다. 이렇게 중국 주도로 인공지능 바둑프로그램은 발전하고, 인공지능바둑대회 등을 개최하면서 각종 룰과 플랫폼, 시스템 표준 등을 갖춰 가고 있다.

AI대국에서 자주 보이던 반집승부가 골락시로 인해 많이 줄었는데 이에 대해 골락시측은 “알파고의 논문에 따른 방법은 AI가 바둑 훈련을 하려면 대량의 컴퓨팅리소스를 필요로 한다. 어떻게 적은 리소스로 알파고를 뛰어넘는 실력에 도달할 수 있을까 하는 것이 당면 과제였다. 골락시는 집수와 승률을 결합한 훈련방식을 만들었는데 이는 두가지 특징이 있다. 하나는 이런 방법은 매번의 훈련 대국 기보의 승패뿐만 아니라 몇 집을 이기고 졌는지, 어떤 곳을 차지했는지 등을 포함한 풍부한 정보를 충분히 사용한다. 간단하게 말해서 한 장의 기보로 아주 많은 연습 대국을 처리할 수 있다. 그래서 골락시는 아주 적은 비용으로 알파고의 실력을 뛰어넘을 수 있었다”고 말했다.

이어 그는 “이런 방법은 골락시에게 수읽기 능력이 생기게 했고, 승패를 계산하고 가능한 상황에서 더 많이 이기려고 해서 골락시는 물러서지 않는 기풍을 갖게 됐다. 만약 사활과 간단한 끝내기 모두 승리를 거두는 상황이라면 골락시는 잡는 길을 선택할 것이다”라고 설명했다.

신진서는 대국 초반 인공지능의 추천수인 ‘블루스팟’ 일치율이 높다고 하여  ‘신공지능(申工智能)’이라고 불린다. 그렇다면 AI의 블루스팟 일치율로 프로기사들의 실력을 평가하는 것이 가능하겠다는 생각이 든다. 하지만 골락시 측은 “이번 결승전 기보를 가지고 카타고를 기준으로 인공지능의 일치율을 체크했는데 릴라제로가 70여점, 골락시가 50여점이 나왔다. 골락시는 다른 방법으로 기사들의 실력을 평가하는 방법을 찾고 있다”고 말했다.

AI가 대국 초반 3-3으로 뛰어드는 전술은 인류가 AI에 대해 경험한 가장 직관적인 체험이라고 할 수 있다. 고도의 해시레이트(Hash Rate: 블록체인 네트워크의 채굴 연산 난이도를 가리킨다) 상황이나 카타고의 PDA엔진(더 과격한 모듈)에서 AI는 소목을 선택한 경우가 훨씬 많다. 2020년 12월 대회에서 릴라제로와 골락시의 대국 중 4개의 소목이 나왔는데 이는 AI도 3-3을 당하면 대응하기 쉽지 않다는 것을 보여주는 것이다.

지금까지 널리 알려져 있는 바둑프로그램의 알고리즘의 유형은 3가지가 있다. 각 돌은 주위에 어떤 영향을 주게 되는데 이런 영향은 거리의 증가와 감소에 따라서 일정한 공식으로 이런 영향을 서로 중첩되게 형세판단과 예상착점의 가치를 계산한다. 이는 바둑의 원리와 상통하는데 각 돌에 대해서 그 돌이 가지고 있는 힘을 계산하는 방식이다. 그리고 라이브러리DB를 만들어 대량의 라이브러리(정석, 기형 등)을 저장해서 그것에 맞게 결과물을 제공하는 방법도 있다. 이는 사실 ‘두점머리는 젖혀라’, ‘씌우면 뛰어라’등과 같은 많은 바둑의 격언과 원리와 관련되어 있으며, 이런 것들은 모두 바둑의 구체적인 상황에 근거해서 만들어진 것이다. 대표적인 것이 몬테카를로 알고리즘이다. 몬테카를로는 난수를 이용하여 함수의 값을 확률적으로 계산하여 최적화, 수치적 통합, 확률 분포로부터 결과물을 도출해 내는 알고리즘으로 수학적인 결과를 얻기 위해 반복적으로 무작위 샘플링의 방법을 이용한다. 쉽게 말해 바둑에서 확률적으로 (결과를 중심으로)승리한 대국의 수에 가중치를 두어 그 수를 최상의 수라고 선택하는 것이다. 또 하나는 목표가 분명한 특정 범위의 국지전에 대해서 인공지능의 검색방법으로 결과를 구하는 방식이다.

체스는 7수를 주고 받는데 약 500억~600억개의 선택이 있다고 한다. 이 숫자는 아주 많아 보이지만 현재 기술로는 충분히 극복할 수 있는 정도다. 하지만 바둑은 터무니없는 수를 배제하면 한수에 대략 100개의 착수 가능점이 존재하지만 14수 이내의 변화는 적게 잡아도 최소 약 1028가지 정도로 인간에게는 벅찬 경우의 수다. 이 때문에 현재는 특정 사활, 끊음, 수상전, 포위망 돌파 등 국지전에서 게임트리(game tree)를 사용해 검색을 진행한다.

현재 세계인공지능 바둑프로그램을 이끄는 나라는 중국이다. 중국은 커제 9단이 알파고와 대결을 벌여 3-0으로 패할 때 커제 9단이 흘린 눈물을 놓치지 않았다. 텐센트와 같은 IT기업들은 ‘4차산업혁명’의 키워드 중 하나인 AI에 적극 대응하면서 빠른 시간에 ‘절예’를 만들었다.

절예는 2016년 3월 4일 완성되어 6월 하순 아마6단의 실력에 이르렀으며, 8월 텐센트 ‘예후바둑’ 플랫폼에서 테스트를 거쳐 커제, 구리, 박정환 등 100여명의 프로기사들을 물리쳤다. 2017년 3월 19일 절예는 UEC배에서 11연승을 거두며 우승을 차지했고, 11월에 세계 정상급 프로기사를 상대로 59연승을 거두었다. 12월 10일 AI용성전 등 세계컴퓨터바둑대회에서 딥젠고를 꺾고 우승을 차지했다.

2018년 1월 17일 저녁 8시반, 커제가 절예를 상대로 인간 최초로 두 점을 깔고 접바둑을 두었지만 77수만에 불계패했다. 2018년 4월 23일, 절예는 공식 중국바둑 국가대표팀 훈련 전용 AI가 됐다. 이어 7월 31일, 절예는 텐센트세계인공지능바둑대회에서 골락시를 7-0으로 꺾고 우승을 차지했으며, 1년 뒤인 2019년 8월 25일, 중신건설증권배 세계인공지능바둑대회에서 역시 골락시를 4-1로 꺾고 우승을 차지하면서 세계대회 4관왕에 올랐다.

중국은 텐센트가 세계인공지능바둑대회를 주최하고 세계 최강급 골락시, 절예를 비롯하여 20개에 가까운 AI바둑프로그램을 선보였다. 국가대표팀도 텐센트가 개발한 ‘절예’를 훈련에 도입했으며, 사설 기관인 거위홍바둑도장 등도 골락시와 협력을 맺어 AI를 훈련에 사용하고 있다. 이젠 누구나 언제 어디서든 프로기사를 능가하는 실력의 AI프로그램들을 스마트폰 버전과 온라인상에서 즐길 수 있게 됐다.  

◇역대 주요 인공지능세계바둑대회

대회명우승전적준우승일시
복건해협은행배골락시(星陣)4-0머틀고(采薇)2020.12.03
제11회 UEC배골락시SOSGLOBIS2019.12.15
중신증권배2019절예(FineArt)4-1골락시2019.08.25
보소프트배(博思杯)골락시3-0바두기(한국)2019.04.29
일본AI용성전2018골락시1-0RN2018.12.16
중신증권배2018골락시4-1AQ2018.08.15
텐센트AI대회절예7-0골락시2018.07.31
貝瑞基因杯봉황(PhoenixGo)2-1절예2018.04.28
일본AI용성전2017절예1-0딥젠고2017.12.10
중신증권배2017딥젠고1-0CGI2017.08.17
제10회 UEC배절예1-0딥젠고2017.03.19

※제10회 UEC배 이후 후원사 유치, 용성전으로 2회 개최 후 다시 UEC배로 복귀

우리나라는 정부의 무지와 기업의 소극적인 의지로 개인 중심의 개발이 주류를 이루면서 다소 행마가 느리다는 느낌이다. 아직까지 한국이 주최하는 그렇다 할 만한 셰계인공지능바둑대회도 없고 AI프로그램도 한돌, 바두기, 돌바람 등이 몇 개에 불과하다.

왜 구글은 4차산업혁명의 핵심키워드 중 하나인 AI를 테스트하기 위해 바둑을 선택했을까? 바둑은 직관적이고 종합적인 데이터를 만들어 내는 게임이다. 데이터가 정형화되어 있다면 전혀 문제가 되지않는다. 우리의 삶과 희로애락의 감정으로 만들어진 데이터는 대부분 비정형화되어 있어서 이를 직관적이고 종합적으로 처리하기가 쉽지않다. AI는 자가학습, 딥러닝 등을 통해 인간의 직관적인 사고에 가깝게 모방하도록 시스템을 만들어 가기 위해서다.

magnifiercross