아이티랩 - 이세돌 “알파고와 대국, 어쩌면 한 판 질 수도”

“아직도 이길 자신이 있습니다. 아직은 인간의 직관과 감각을 인공지능이 따라잡는 것은 무리가 있지 않을까 하고 생각하고요. 하지만 이번 기회에 알파고의 알고리즘에 관한 설명을 들으면서 어느 정도는 인간의 직관을 모방하는 것이 가능하겠구나 하는 생각을 하게 됐습니다. 5대0은 아니고, 어쩌면 한 판 정도는 질 수도 있겠다 싶어 내일 긴장해야 할 것 같습니다.”

구글의 인공지능 바둑 시스템 ‘알파고’와 대국을 앞둔 이세돌 9단이 심경을 밝혔다. “5 대 0으로 이길 것 같다”는 기존의 확고한 자신감과 달리 이날 이세돌 9단은 “그 전에 생각한 것만큼 큰 차이는 나지 않을 것 같아 더욱 많은 준비를 해야 한다고 느꼈다”라며 다소 긴장한 모습을 보이기도 했다.

구글코리아와 딥마인드, 이세돌 9단이 3월8일 서울 포시즌스 호텔에서 대국 사전 간담회를 열었다. 에릭 슈미츠 구글 회장과 데미스 하사비스 딥마인드 CEO, 이세돌 9단, 한국기원 관계자들이 현장에 참여했다. 중국과 일본, 영국 등 해외 취재진도 이세돌 9단과 알파고의 대국에 큰 관심을 드러냈다. 이세돌 9단과 알파고는 오는 9일 포시즌스 호텔에 마련된 특별 대국장에서 오후 1시부터 5번기 대국의 첫 번째 대국을 진행한다.

  • 생중계 채널: 구글 딥마인드 공식 유튜브 채널(링크)
  • 대국 방식: 호선
  • 상금: 100만달러
  • 대국 일정(3월11일 금요일, 14일 월요일은 대국 없음)
    • 1국 : 3월9일(수) 오후 1시
    • 2국 : 3월10일(목) 오후 1시
    • 3국 : 3월12일(토) 오후 1시
    • 4국 : 3월13일(일) 오후 1시
    • 5국 : 3월15일(화) 오후 1시
alphago_800

이세돌 9단

기술이 빚은 알파고의 ‘직관’, 이세돌 위협할까

바둑은 경우의 수가 무척 많은 보드게임이다. 체스는 수를 둘 수 있는 경우의 수가 20여가지에 불과한데, 바둑은 200개가 넘는다. 바둑에서 나올 수 있는 모든 경우의 수는 10의 170제곱 이상이다. 우주의 원자 수보다 많은 경우의 수를 갖고 있다고 여겨지는 것이 바로 바둑의 세계다. 체스와 달리 그동안 인공지능이 인간의 바둑에 감히 도전하지 못했던 것도 이 같은 이유에서다. ‘무작위 대입(Brute Force)’이나 이미 프로그래밍된 대로 수를 놓는 것이 불가능한 탓이다.

알파고의 핵심은 최적의 수를 찾기 위해 경우의 수를 좁혔다는 데 있다. 딥마인드는 이 기술을 구현하기 위해 두 가지 인공신경망 기술을 함께 사용한다. 바로 정책망과 가치망이다.

정책망이라는 이름의 인공신경망은 특정 상황에서 어떤 수를 둘지 선택하도록 하는 알고리즘이다. 인간 바둑 전문가들의 기보를 학습하고, 수십만번 이상의 자가경기를 통해 실수를 줄여나가는 기법으로 알고리즘을 개선하는 과정을 반복했다. 반복되는 정책망 개선으로 알파고는 인간이 두는 수를 비슷하게 모방할 수 있게 됐다는 게 구글의 설명이다.

이와 달리 가치망은 게임의 승패를 분석하도록 설계된 인공신경망이다. 데미스 하사비스 딥마인드 CEO는 가치망을 “인간 바둑과 컴퓨터 대결의 성배”라고 표현하기도 했다. 어떤 위치에 돌을 두었을 때, 누가 이길 것인지를 분석하는 기술을 말한다. 정책망으로 다음에 어떤 수를 둘 것인지를 탐색해 경우의 수를 좁히고, 가치망으로 탐색의 깊이를 더하는 것이 알파고의 기본 원리다.

이세돌 9단은 바둑을 둘 때 가장 중요한 자질로 ‘직관’을 꼽았다. 너무 많은 경우의 수가 존재해 인간은 모든 경우의 수를 탐색할 수 없기 때문이다. 딥마인드의 알파고는 인공신경망 기술과 머신러닝으로 예측할 수 있는 수의 범위를 좁히는 방식으로 바로 인간의 ‘직관’을 모방한 것이다.

데미스 하사비스 CEO는 “우리는 알파고가 인간의 직관을 잘 모방할 수 있느냐를 테스트했다”라며 “지금까지 알파고의 능력 향상에는 한계가 없는 것으로 보고 있다”라고 설명했다.

alphgo_2_800

‘알파고’의 탐색트리 알고리즘. 정책망이 녹색 영역을 넓혀 선택할 수 있는 경우의 수를 줄이고, 가치망이 탐색의 깊이(보라색 영역)를 더하는 알고리즘이다.

“하드웨어 개선보다는 알고리즘 개선으로”

알파고는 지난 2015년 10월 유럽의 바둑 챔피언 판 후이 2단을 5대0으로 꺾으며 처음으로 프로 바둑기사를 이긴 인공지능 시스템으로 등극했다. 그 직후 이세돌 9단에 승부를 걸었다. 그로부터 약 5개월여의 시간이 흘렀다. 알파고는 판 후이 2단과의 경기 이후에 어떻게 이번 대국을 준비했을까. 이세돌 9단을 꺾기 위한 특별한 고도화 기술은 사요하지 않았으되, 하드웨어보다는 알고리즘을 개선하는 방향으로 시스템을 발전시켰다는 게 데미스 하사비스 CEO의 설명이다.

데미스 하사비스 CEO는 “이세돌 9단과 대국을 위해 특수한 훈련을 하지는 않았다”라면서도 “하지만 2015년 10월 버전과 차이는 있으며, 그동안 수많은 자가학습 데이터를 얻어 강력한 데이터를 창출할 수 있을 것”이라고 설명했다.

google_alphago_10_800

데미스 하사비스 딥마인드 CEO(왼쪽)와 이세돌 9단

알파고는 10만여건이 넘는 인간 바둑 기사의 기보를 바탕으로 수천만번이 넘는 자가대국을 펼치는 방식으로 시스템을 고도화한다. 판 후이 2단과의 대국에 임하기 전에 했던 훈련 방식과 판 후이 2단 이후 이세돌 9단과의 대국을 준비하며 실시한 훈련 알고리즘 사이에 본질적인 차이는 없다는 설명이다. 다만, 판 후이 2단과의 대국 이후 5개월여의 시간이 흐른 만큼 더 정교한 대국을 펼칠 수 있을 것이라는 게 데미스 하사비스 CEO의 설명이다.

데미스 하사비스 CEO는 “판 후이 2단과 대국을 할 때와 컴퓨팅 파워는 동일하고, 우리의 알고리즘은 컴퓨팅 파워가 강력해질수록 결과의 기댓값이 낮아진다는 것을 발견했다”라며 “너무 많은 컴퓨팅 파워를 사용하는 대신 알고리즘을 고치는 방향으로 시스템을 개선했다”라고 설명했다.

이세돌 9단과 구글 딥마인드 알파고의 대국은 9일 오후 1시부터 시작된다. 총 대국 시간은 약 4~5시간 정도 될 것이라는 게 구글과 전문가들의 관측이다. 모든 경기는 딥마인드 유튜브 채널을 통해 생중계된다.

의견 0 신규등록      목록