KBS WORLD Korean

검색

English

검색

한국어

About KBS Go to KBS

검색 닫기

Go Top

생활

인간을 닮아가는 인공지능, 알파고

2016-03-11

그동안 소문만 무성했던 인간과 기계의 대결, 알파고와 이세돌 9단의 바둑 대결 전반부가 마감되었습니다. 총 5번으로 예정되어 있는 대국 중에 어제까지 2번의 대국이 끝났는데, 먼저 기선을 잡은 쪽은 알파고였습니다. 아직 세 번의 대국이 남았지만, 대결이 시작되기 전 많은 전문가들이 이세돌 9단의 우위를 점쳤던지라, 이번 2번의 경기가 준 파장은 만만치 않습니다. 이에 알파고의 개발자 데미스 하사비스는 ‘우리는 달에 착륙했다(We landed it on the moon)!'이라는 표현을 쓰기도 했습니다. 그래서 오늘은 알파고에 대해서 좀더 알아보고자 합니다.

구글이 개발한 알파고
알파고를 딥마인드는 지난 2010년,데미스 하사비스(Demis Hassabis)[1], 셰인 레그(Shane Legg), 무스타파 술레이만(Mustafa Suleyman)이 공동창업한 영국의 인공지능 관련 기업이고, 2014년 구글에 인수되었습니다. 딥마인드 개발진의 주요목표는 기계학습(machine learning)과 신경과학(neuroscience)를 기반으로 인간 지능을 분석, 구현하는 것. 인공물에 인공 지능을 탑재하는 것 뿐 아니라 인간 지능의 궁극적인 이해를 목표로 두고 있다고 합니다. 딥마인드가 개발하는 시스템은 IBM의 딥블루를 비롯, 여지껏 개발 된 다른 인공지능과는 달리 미리 프로그램 되어 있는 것이 아니라 기계학습을 통해 정보를 처리하기 때문에 특정 분야에 국한되어 이용되기보다는 범용적으로 지능을 발휘할 수 있다는 특징이 있습니다. 이 것이 알파고의 가장 큰 특징입니다.

범용적 지능을 이용한 알파고
지금껏 컴퓨터가 인간보다 뛰어나다고 아무 의심없이 받아들였던 분야가 연산처리 능력입니다. 컴퓨터는 인간에 비해 훨씬 더 빠르게 더 복잡한 수식을 한치의 오차도 없이 계산할 수 있습니다. 그런데 이 것은 컴퓨터의 장점인 동시에 약점이 되기도 합니다. 예를 들자면 계산에 뛰어난 컴퓨터의 능력은 이미 1997년 IBM에서 만들어낸 체스프로그램 딥 블루(Deep Blue)가 당시 체스 세계챔피언인 카스파로프에게 이기며 증명한 바 있습니다.

당시 딥 블루는 엄청나게 빠른 계산 속도를 무기로 해서 흔히 몬테카를로 방법이라고 부르는 랜덤샘플링 방법을 이용해 체스를 두었습니다. 몬테카를로 방법이란 쉽게 말해 여러 가지 경우의 수가 있을 때, 이 중에서 몇 가지를 무작위적으로 추출해 이들을 기반으로 값들을 계산해 종합하는 것입니다. 간단히 말해 딥 블루는 체스를 두면서 상대가 한 수를 둘 때마다 이 수를 바탕으로 앞으로 펼쳐질 수 있는 가능한 게임, 즉 이전부터 내장된 기보들을 비교해 무작위로 시뮬레이션 한 뒤에 그 중에서 가장 가능성이 높은 시나리오를 선택해 다음 수를 두도록 만들어졌습니다. 다만 수퍼컴퓨터의 엄청난 계산 능력을 바탕으로 인간 챔피언이 한 수를 두면 다음에 펼쳐질 가능한 기보를 한 번에 만 판 이상씩 계산할 수 있고, 이중에서 가장 승률이 높을거라 판단되는 시나리오에 따라 체스말을 움직였던 것이죠.

딥 블루 VS 카스파로프
아닙니다. 원래 딥 블루가 카스파로프에게 도전한 건 1996년입니다. 당시에도 첫 판은 카스파로프가 졌지만, 딥 블루가 기보에서 힌트를 얻는다는 걸 깨달은 카스파로프가 초반에 일부러 이상하고 엉뚱하게 체스말을 두는 바람에 그런 방식에 대한 기보에 대한 처리 능력이 부족했던 딥 블루는 나머지 4판을 내리 지고 맙니다. 하지만 이에 고무된 IBM의 개발진이 모두 달라붙어 1년 동안 프로그램을 업그레이드하고 카스파로프에 대한 분석을 마친 끝에 1997년 재대결을 신청하고 결국에는 카스파로프를 상대로 2승 3무를 따내 딥 블루가 승리하게 됩니다. 그럼 인공지능 체스챔피언이 탄생한 건 벌써 20여년 전의 일인데, 바둑은 왜 이토록 오래 걸렸는가?
그건 체스와 달리 바둑의 기보가 거의 무궁무진했기 때문입니다. 체스는 각각 16개, 총 32의 말을 이용하고 각 말들이 움직이는 규칙과 더 중요하고 덜 중요한 말들이 분명하게 정해져 있기 때문에 한 수에 대한 예상 가능한 다음 수를 계산하는 프로그램을 짜는 것이 더 쉬웠지만, 바둑은 19*19=361개의 점에 모두 돌을 올려놓을 수도 있고, 각 돌의 차이가 있는 것이 아니기에 아무리 연산능력이 빠른 슈퍼컴퓨터라도 모든 경우의 수를 계산할 수 없습니다. 실제로 바둑판에서 벌어질 수 있는 모든 경우의 수는 10^171제곱수라고 하는데, 이는 체스보다는 100제곱배 더 복잡하고, 우주 전체에 존재하는 원자의 수보다 많을 정도라고 하니 제 아무리 수퍼컴퓨터라 하더라도 이를 다 계산할수 없어서 지금껏 사람보다 잘 두는 계산 기계를 개발하는 건 불가능이라 여겨졌답니다.

알파고 VS 이세돌 9단의 대결
그건 바로 알파고가 사람처럼 생각했기 때문입니다. 다시 말해 알파고를 개발한 개발진들이 기계에게 사람을 닮도록 프로그래밍하는데 성공했다는 것입니다. 일반적으로 사람은 바둑을 둘 때 아무리 많은 경우의 수가 있다고 하더라도, 그 걸 다 계산해보지는 않습니다. 대충 몇 가지의 예상 가능한 시나리오를 그리고 그에 따라 판단하지요. 그 때 어떤 시나리오를 택할 지는 그 사람의 경험과 감각, 혹은 직관이라 불리는 것에 따릅니다. 그런데 이 중에서 경험은 컴퓨터에게 가르칠 수 있지만, 직관은 어떻게 가르칠 수 있었을까 이게 궁금합니다. 먼저 개발진들은 알파고에게 바둑 아마추어 6~9단의 실력자들이 둔 바둑 16만건의 기보를 저장시켰습니다. 이 기보를 통해 알파고는 이미 그 안에 나타난 3천만 착점을 익혔습니다. 이를 지도학습이라 합니다. 이를 기반으로 수천만대국의 가상 대국을 진행하면서 그 중에서 좋은 결과가 나온 경우를 더욱 강화시키는 강화학습 정책망을 사용했다고 합니다. 즉, 무조건 모든 기보를 다 외우는 게 아니라, 무작위적으로 바둑을 계속하면서 더 효과가 좋았던 것을 골라내 가중치를 두는 방식을 이용했다는 것이죠. 이는 인간의 신경망과 매우 비슷합니다. 사람의 뇌는 가능성을 가지고 태어납니다. 즉, 아기들은 태어날 때 장차 말을 할 수 있는 능력을 갖추고는 있지만 어떤 언어를 사용하게 될지는 결정되어 있지 않습니다. 따라서 아이는 자라면서 자신이 가장 많이 듣고 접한 언어를 배워나갑니다. 이는 아기의 뇌를 구성하는 신경세포의 시냅스가 처음에는 이어지고 있지 않다가 자주 반복되는 언어를 기억하도록 회로가 형성된 결과입니다. 이래서 알파고는 시간이 지나면 지날수록, 더 많은 기보를 볼수록, 더 많은 가상대결을 해볼수록 더욱 유리한 상황에 대한 강화 경험이 늘어 더욱 좋은 판단을 할 수 있는 형태로 만들어졌습니다.

인간적인 면모를 지닌 알파고
즉, 알파고는 실제 대국에서 상대가 한 수를 두면 그 수에 이어질 다음 판을 몬테카를로 기법을 이용해 가능성이 높은 예상 시나리오 중에 무작위로 몇 가지를 선택한 뒤, 이를 지도학습시 익혔던 기보들과 비교하고, 강화학습시 익혔던 가중치를 계산해 다음 수를 두는 기법으로 바둑을 둡니다. 그리고 더욱 신기한 것은 이렇게 인간처럼 바둑을 두는 방법을 가르치다 보니 알파고도 실수나 모험처럼 ‘인간다운’ 면모를 보이기도 합니다. 그리고 이번 이세돌 9단과의 대국에서 내리 2판을 먼저 이김으로써, 컴퓨터답게가 아니라 인간답게 바둑을 두기 시작한 것이 꽤 좋은 판단이었다는 이야기를 듣고 있습니다.

인공지능 알파고가 주는 의미
사람들은 인공지능인 알파고가 바둑 최고수인 이세돌에게 연달아 불계승을 거두는 것을 보면서 두려워하기도 합니다. 최근 들어 체스와 바둑 뿐 아니라, 인간 고유의 영역이라고 생각되었던 미술과 음악계에도 인공지능이 들어서고 있습니다. 예를 들어 A Neural Algorithm on Artistic Style이라는 프로그램은 사진과 함께 유명한 화가의 스타일을 선정해 입력하면 사진을 그 화가의 그림 스타일을 반영해 변형시켜 줍니다. 예를 들어 풍경 사진을 넣고, 화가와 그림풍을 -고흐의 별이 빛나는 밤에-로 치면 그 느낌이 나도록 변형시켜 준다는 것인데, 피카소나 뭉크, 칸딘스키의 느낌으로도 간단히 변주할 수 있습니다. 그저 컴퓨터 화면에 사진과 텍스트 몇 줄만 입력하면 말이죠. 이런 기계들이 하루가 멀다하고 등장하니 사람들은 조금 두려운 마음이 드나 봅니다. 머지않아 인간들이 기계에 밀려나고, 기계에 지배당하는 삶을 살게 되는 것이 아닐까 하고요.
하지만 달리 생각해보면 이번 결과는 인간 스스로의 위대함을 우리에게 다시금 깨닫게 해주는 계기가 되기도 합니다. 알파고는 집단 지성입니다. 말했듯이 알파고는 16만명의 기보를 통해 학습했고, 그 것을 분석해 그들의 감각을 습득했습니다. 집단 지성이 뛰어난 개인보다 더 우수하다는 것을 우리는 오래도록 알고 있었고, 그 결과물 중 하나가 알파고입니다. 또한 알파고는 가장 인간다운 것이 가장 위대한 것이라는 것을 알려준 대상이기도 합니다. 컴퓨터의 장점을 극대화시키기보다는 인간을 닮아가도록 노력한 것이 승리의 결정적인 열쇠였다는 점이 그것입니다. 또한 마지막으로 인류는 이제 창조주를 이길 수 있는 또다른 존재를 만들어냄으로써 자신들이 얼마나 많은 성과를 이룩해냈는지 스스로 증명해냈습니다. 약 20만년 전, 돌조각을 들고 초원을 쏘다니던 ‘두발로 걷는 털없는 원숭이’가 이룩해낸 것 치고는 상당히 대견한 결과가 아닐까요.

facebook

twitter

우리 사이트는 보다 나은 서비스를 제공하기 위해 쿠키와 다른 기술들을 사용하고 있습니다. 이 사이트를 계속 이용함으로써 당신은 이 기술들의 사용과 우리의 정책에 동의한 것으로 간주합니다. 자세히 보기 >