아이티랩 - 알파고 4년…AI에 봄이 오는 신호였다

[지디넷코리아]

2016년 1월 29일 세계적인 과학잡지 ‘네이처’에 논문 한 편이 게재됐다. 한국 시간으론 새벽 2시 경에 공개된 이 논문 제목은 ‘심층 신경망과 트리 검색으로 바둑게임 정복하기’였다.


데미스 하사비스, 데이비드 실버, 아자 황 등 20명이 공동 집필한 논문이었다. (☞ 네이처 논문 바로 가기)


논문 발표와 함께 인공지능(AI)이 사상 최고로 프로바둑 기사와 대국에서 승리했다는 뉴스가 날아들었다. 구글 자회사 딥마인드가 개발한 알파고는 이렇게 세상에 소개됐다.


당시 알파고와 대결했던 판후이 2단은 유럽 챔피언이었다.

구글 알파고와 판후이 2단이 대국을 하는 장면. 알파고가 수를 놓으면 맞은 편에 앉은 사람이 대신 바둑판에 놔주는 형식으로 진행됐다. (사진=유튜브 캡처)


하지만 이날 많은 사람들의 관심을 끈 뉴스는 따로 있었다. 알파고와 이세돌 9단 간의 세기의 바둑 대결 소식이었다. 대국 일정은 3월초로 잡혔다.


■ 가치망·정책망과 강화학습 결합해 새 역사 만들어


데미스 하사비스 등이 발표한 논문은 알파고의 바둑 정복 과정이 꼼꼼하게 정리돼 있었다. 당시 나도 논문을 구해 읽었다. ‘문송족’이 이해하기엔 만만치 않았지만, 그래도 학창시절의 짧은 수학 상식과 각종 상상력을 총동원해 간신히 읽어낼 수 있었다. (☞ 구글 알파고는 어떻게 바둑경기 이겼나 바로 가기)


논문은 바둑 경기에 통계적 사고를 접목했다. 바둑처럼 복잡한 게임은 ‘b의 p승’의 경우의 수를 갖는다는 것. 이 때 b는 각 위치당 합법적으로 움직일 수 있는 수로 흔히 ‘게임의 넓이’로 통한다. 반면 ‘p승’은 한 경기에 두게 되는 수를 의미하며 ’게임의 깊이’로 통한다.


이런 계산 방법을 적용할 경우 바둑은 ‘b=250, p=150’ 수준이다. 250개 정도 공간에 150수 가량을 두면 승부가 난다는 얘기다. 알파고는 이렇게 많은 경우의 수를 줄이는 방법으로 최적의 수를 찾아냈다.


이를 위해 알파고는 가치망(value networks)과 정책망(policy networks)이란 두개의 신경망을 구성했다. 여기에 몬테카를로 트리 검색(MCTS)을 결합했다. 정책망은 다음 번 돌을 놓을 위치를 선택하며, 가치망은 승자를 예측하는 역할을 한다.

구글 알파고 프로그램의 훈련 개념도. 지도학습과 강화학습을 거친 뒤 가치망 훈련을 시키는 과정을 거쳤다. (사진=사이언스/ 구글)


구글은 정책망 지도학습과 정책망 강화학습, 그리고 가치망 강화학습 등을 통해 가장 높은 승률을 기록할 수 있는 위치를 찾아냈다.


당시 발표된 논문은 꽤 흥미로웠다. 무한대에 가깝다고 생각했던 바둑을 ‘통계’와 ‘확률’ 계산 속으로 가져온 부분은 놀랍기까지 했다.


하지만 알파고가 이세돌 9단을 꺾을 것으로 예상한 사람은 많지 않았다. “그래 봐야 판후이는 프로 2단 수준 아니냐”는 게 대체적인 반응이었다. 2단은 꺾었지만, 세계 최고수인 이세돌 9단은 수준 자체가 다르다는 생각이 일반적이었다.


이후 벌어진 일은 우리가 아는 그대로다. 알파고는 이세돌 9단과의 대국까지 남은 40여 일 동안에도 엄청나게 실력을 향상시켰다. 그리고 관심이 집중된 세기의 바둑대결에서 4대 1로 완승을 거두면서 ‘알파고 충격’을 현실화시켰다.


■ 알파고는 AI에 대한 대중적 관심 키운 결정적 계기


4년 전 공개된 알파고는 여러 의미를 갖는다. 그 해 초 스위스 다보스에서 열린 세계경제포럼(WEF)에서 제기된 ‘4차 산업혁명 담론’이 어떤 의미인지 피부로 느낄 수 있도록 만들어줬다.


알파고는 AI 붐을 촉발하는 데도 큰 역할을 했다. ‘알파고 쇼크’ 이후 정부나 기업들 모두 AI에 엄청난 관심을 보이기 시작했다.


알파고의 기반이 된 딥러닝은 ‘AI에 닥친 세 번째 겨울’을 끝내는 데 결정적인 기여를 했다. 알파고는 봄이 왔다는 신호탄이나 다름 없었다.


알파고 쇼크 이후 4년. 이제 AI는 차세대 국가 경쟁력의 밑거름이 될 것이란 기대를 받고 있다. 올해 들어 정부는 ‘AI 퍼스트’ 드라이브를 걸고 있다.

알파고 개발자인 데미스 하사비스(왼쪽)와 이세돌 9단. (사진=구글 공식 블로그)


물론 AI의 또 다른 겨울이 오고 있는 것 아니냐는 우려 섞인 시선도 있다. 제대로 된 상용 서비스가 없다는 게 그 근거다. 알파고의 산파인 구글 딥마인드도 적자를 면치 못한다는 점 역시 ‘또 다른 AI 겨울'의 근거로 거론된다.


이런 우려에도 불구하고 AI는 반도체 이후 또 다른 ‘산업의 쌀’이 될 것이란 기대를 받고 있다. 4년 전 오늘 공개된 알파고 관련 논문은 이런 기대의 밑거름이 됐다는 점에서 큰 의미가 있는 것 같다.


[덧글] 알파고 얘기가 궁금한 분들에겐 넷플릭스가 제작한 ‘알파고 다큐멘터리’를 권한다. 알파고 대국 당시 상황이 잘 묘사돼 있다.




▶ IT 세상을 바꾸는 힘 <지디넷코리아>,
▶ IT뉴스는 <지디넷코리아>, 게임트렌드는 <뉴스앤게임>
▶ 스마트폰으로 읽는 실시간 IT뉴스 <모바일지디넷>
[저작권자ⓒ메가뉴스 & ZDNet & CNET. 무단전재 및 재배포 금지]

의견 0 신규등록      목록