메뉴 바로가기 본문 바로가기
Go Top

생활

인공지능 번역

2016-12-16

인공지능 번역
요즘은 국제화, 세계화 시대라 외국어 하나쯤은 필수라고 하는데, 사실 다른 나라 말을 배운다는 것은 생각보다 쉽지 않습니다. 특이나 우리나라에서는 영어 공부에 한이 맺힌 분들이 꽤 많은데요, 어린 시절부터 영어를 배우고, 학교에서도 정규 과목으로 배우지만, 여전히 영어 공부는 해결하지 못한 숙제처럼 느껴집니다. 그런데 우리 아이들은 어쩌면 영어를 공부하느라 받는 스트레스를 덜 받을지도 모르겠네요.

구글의 새로운 번역 기술
현지시각으로 지난 2016년 11월 15일부터 구글은, 8개 언어에 대한 번역 서비스에 ‘신경망 기계번역(NMT)’ 기술을 적용하기 시작했다. 한국어를 비롯해 영어, 프랑스어, 독일어, 스페인어, 중국어, 일본어, 터키어가 이에 해당합니다. 그런데, 실제 저도 써 봤는데, 확실히 이전에 비해 번역 품질이 향상되었더군요. 특히나 비교적 정제되고 수사적 표현이 적은 이공계 논문의 경우에는 정말로 ‘읽을만한’ 번역을 내주어서 좀 놀라기도 했습니다.
먼저 언어에 대해서 알아보기로 하지요. 사람이 다른 동물들과 구별되는 특징 중의 하나는 음성 기호로 구성된 언어를 자유자재로 사용할 수 있다는 것입니다. 물론 침팬지나 돌고래 등의 동물들은 소리로 의사소통을 하는 것이 가능하다고 알려져 있지만, 그래도 그 음성기호의 종류나 표현력의 가능성 면에서는 사람의 언어를 따라올 수 없지요. 실제로 사람의 유전자 속에는 언어와 관련된 언어 유전자가 존재합니다. 물론 영장류에게는 이 유전가가 기능하지 못하지요. 하지만, 문제는 사람들이 모두 동일한 언어를 사용하는 것이 아니라, 서로 다른 말을 사용한다는 것입니다. 사람의 뇌는 ‘말을 배울 수 있는 능력’은 가지고 태어나지만, 어떤 말을 쓸지는 결정되지 않은 채 태어나기 때문이지요. 그런데 이런 ‘열린 언어 능력’ 때문에 인류는 또다른 문제에 봉착하게 됩니다. 인류의 언어 종류는 대략 3,000~4,000가지 정도 되는데, 각각의 언어들은 대부분 서로 의미가 통하지 않기 때문에, 서로 다른 언어를 쓰는 사람들은 의사소통에 심각한 문제가 생겨납니다. 바벨탑을 쌓아 하늘에 오르려는 인간들의 꿈이 좌절된 것도, 기술력이나 의지의 문제가 아니라, 언어의 문제였듯이 말이죠.

그래서 오래 전부터 서로 다른 언어를 구사하는 나라나 민족들은 서로 교류를 위해 양쪽 언어를 할 줄 아는 사람들을 필요로 했습니다. 조선시대에는 사역원에서 역관들을 가르쳤고, 과거 시험에서도 역과가 따로 있었지요. 사역원에서는 당시의 4대 외국어인 한학, 몽학, 청학, 왜학, 즉 중국어, 만주어, 몽골어, 일본어를 가르쳤다고 합니다. 하지만 외국어를 배운다는 것은 상당한 시간과 노력이 필요한 일이어서, 대부분의 사람들은 자신의 모국어 하나만을 할 수 있었지요. 그러니 세계화가 점점 진행되면서, 더 다양한 나라의 사람들과 그보다 더 다양한 언어들이 겹치는 일이 많아지니 외국어 번역의 필요성이 점점 커졌고, 급기야는 기계를 이용해서 언어를 번역하는 방법을 생각내기도 합니다. 즉, 기계 번역이 등장한 것인데요, 기계 번역이란 사람들이 구사하는 자연 언어를 기계를 이용해 다른 언어로 번역하는 기술을 뜻합니다.

기계 번역의 역사
기계 번역의 개념은 이미 17세기에 시작되었다고 합니다. 당대에 쌍벽을 이루었던 철학자이자 수학자였던 독일의 라이프니츠와 프랑스의 데카르트는 서로 다른 언어들 사이에서 대칭이 되는 단어들을 매칭시키는 이론을 고안한 바 있다고 합니다. 하지만 이 것이 실제 번역기의 개발로 이어진 건 20세기에 들어와서였습니다. ‘번역 기계’라는 이름으로 최초로 특허 신청이 된 건 1930년대로, 세계 공용어를 목표로 제작된 에스페란토어를 기반으로 사전을 비교해 서로 다른 언어를 매칭시켜주는 기계였습니다. 즉, 제가 ‘사람’이라는 단어를 이 기계에 입력하면 기계는 에스페란토 사전을 뒤져 사람을 의미하는 persono로 번역하고, 이를 다시 영어 사전과 비교해 person이라는 단어로 바꾸어주는 것이었죠. 초기의 기계 번역은 초기에는 규칙 기반 기계번역(Rule-based Machine Translation)이나 예제 기반 기계번역(Example-based Machine Translation)이었습니다. 특정 단어는 어떤 단어로 변환한다는 규칙이나, 많이 사용하는 문장의 뜻을 예제로 미리 입력해 놓고 해당되는 말을 찾아내는 것이었지요. 하지만, 애초에 많은 언어들이 같은 어휘를 가지고 있는게 아닌데다가 사람들이 항상 같은 형태의 말을 사용하는 것도 아니고, 문맥에 따라서 같은 어휘가 다르게 쓰일 때도 많기 때문에 기계 번역은 어색할 뿐 아니라, 번역을 했더니 무슨 뜻인지 더 모르겠는 경우도 많았지요. 예를 들어 영어로는 I'm sorry라는 하나의 문장이 우리 말로는 미안해/미안합니다/죄송합니다 라고 상대에 따라 반말과 높임말로 나뉘어지고, 때로는 미안하다는 뜻이 아니라, ‘유감입니다’라는 뜻으로 번역되기도 하거든요. 그나마 어순이 같고, 같은 문화권에 속하는 언어들, 예를 들어 한국어-일본어라든가, 스페인어-이탈리아어,이라면 그나마 대응도가 높아서 좀 낫지만, 어순도 다르고 어법도 다른 한국어-영어의 경우, 더욱 알 수 없는 외계어가 만들어지는 경우도 많았지요.

기계 번역과 인공지능 번역
하지만 이번에 등장한 새로운 타입의 번역기는 올봄에 많은 사람들에게 충격을 주었던 알파고가 이용한 딥러닝 방식의 ‘인공신경망 번역기(Neural Machine Translation)’입니다. 이것도 역시 자료를 수집하고 통계처리를 거치는 방식은 비슷하지만, 이번에는 언어를 단어나 구문 단위로 쪼개지 않고, 문장 전체 단위로 번역합니다. 덕분에 기존의 어색한 번역투와 달리 사람이 말하는 것 같은 문장(자연어)으로 표현할 수 있게 되었지요. 알파고가 고수들의 기보 16만 건에 대한 데이터를 바탕으로 수없이 많은 가상 대국을 펼쳐 그 중에서 승률이 높은 결과에 가중치를 두어 바둑을 두었던 것처럼, 인공신경망 번역기도 같은 방식을 사용합니다. 그래서 일단은 구글링을 통해 수집한 수많은 문장들의 데이터를 이미 가지고 있어서, 일단 통계적으로 번역한 뒤, 번역 후 가장 관련성이 높은 결과를 추리고, 다시 사람이 말하는 것처럼 문장을 재구성하기 때문 ”입니다. 또한 딥러닝 방식의 알파고가 가상대국을 하면 할수록 더욱 더 바둑의 고수가 되었듯이, 이 인공신경망 번역기 역시 더 많은 사람이 사용할수록 번역 능력이 향상될 가능성이 높습니다. 이 인공지능 번역기는 기존의 번역기에 비해, 번역 오류율이 평균 60% 정도 줄어들었다는 보고가 있습니다. 특히나 논문이나 매뉴얼 등 정제된 문장을 사용하는 경우, 그 오류는 더욱 줄어들고 있습니다.

번역의 미래
이제 영어공부를 할 필요도 없고, 번역가들은 생계가 위험받는 걸까요? 물론 당장에 그런 일은 없을 것입니다. 현재의 인공신경망 번역기도 오류는 있어서 한국어를 영어로 번역하는 경우, 같은 문장이라도 어떤 어순을 사용하느냐에 따라, 혹은 조사에 따라 완전히 다른 결과를 내놓기도 합니다. 예를 들어 “옛날에 한 마리의 백조가 살았습니다”라는 문장을 번역기를 이용해 영어로 번역하면 “Once upon a time, a swan lived.”라고 제대로 번역하지만, “옛날에 백조 한마리가 살았습니다.”라고 어순을 바꾸고 조사를 뺀, 문장을 넣으면 “The 100,000,000,000,001(one hundred trillion 1) lived long ago.”이라고 번역하거든요. 또한 뜻은 통해도 뭔가 문장이 어색해 보이기도 하고, 농담이나 반어적 표현을 그대로 번역해 앞뒤가 안 맞기도 하고, 때로는 문화적 차이로 인해 직역하면 말이 되지 않아 의역을 해야 하는 경우도 많습니다. 우리는 어쩌면 이제 외국어보다는 모국어를 더 잘해야 하는 시기가 올지도 모릅니다. 약간은 어색하게 번역된 문장을 자연스럽게 다듬고, 앞뒤의 문맥과 문화적, 시대적인 특성을 감안해 적절한 표현으로 바꾸기 위해서는 오히려 모국어의 정확한 사용능력이 더욱 필요하거든요. 또한 문학적 감수성이나 단어가 가지는 묘한 뉘앙스의 차이는 숙련된 번역가가 아니면 흉내조차 낼 수 없는 경우가 많으니까요.
분명한 건, 기계는 이제 꽤나 똑똑해지고 있다는 것입니다. 그리고 이에 맞춰 사람들이 하던 일들을 대신하기 시작했다는 것이죠. 이제 우리가 할 일은 기계가 우리의 일자리를 빼앗는다고 두려워하기만 하는 것이 아니라, 기계가 더 잘 할 수 있는 일과 사람이 더 잘할 수 있는 일들을 명확히 구분하는 눈과, 사람만이 할 수 있는 고유한 능력을 개발하는 것이겠지요.
Close

우리 사이트는 보다 나은 서비스를 제공하기 위해 쿠키와 다른 기술들을 사용하고 있습니다. 이 사이트를 계속 이용함으로써 당신은 이 기술들의 사용과 우리의 정책에 동의한 것으로 간주합니다. 자세히 보기 >