시사정보 큐레이션/국내외 사회변동外(1)

[인공지능 혁명] 통역사와 통번역 관련학과의 소멸 시대가 온다

배셰태 2016. 10. 28. 14:47

인공지능: 통역사 통역학과의 소멸이 온다. 인간처럼 언어를 통역할 수 있는 컴퓨터. 통번역이 점차 인공지능이 대체한다

인데일리 2016.10.24 박영숙 세계미래회의 한국대표

http://www.indaily.co.kr/client/news/newsView.asp?nBcate=F1002&nMcate=M1004&nIdx=31726&cpage=1&nType=1

 

<중략>이미지

▲ 인공지능혁명2030 저자 박영숙과 벤고르첼

 

인간처럼 언어를 통역할 수 있는 컴퓨터

 

<중략>

 

지난주에 발표된 논문에서 구글의 '신경망 번역시스템(Neural Machine Translation system, GNMT)'는 구글의 구(phrase) 기반 시스템에 비해 평균 60% 번역 오류를 감소시켰다고 발표했다. 신경망 번역시스템은 딥러닝을 사용하며 인간의 두뇌와 같은 방식으로 ‘사고’하는 것을 목표로 한다.

 

생물학적 두뇌에서 인공 두뇌로

 

딥러닝 소프트웨어는 뇌의 신피질 구조를 따르고 있다. 신피질은 대뇌피질 중 발생적computer-translate-google-human-level-11으로 최근에 분화된 것이며 사람의 뇌의 역할 중에서 운동, 지각, 시각, 청각, 고도의 정신작용, 학습 등에 관한 역할을 수행한다.

 

신피질은 뇌의 3/4를 차지하며 6층 구조를 이루고 있다. 각 층에는 100억 개에서 140억 개의 다양한 뉴런이 존재하고 있다. 딥러닝 소프트웨어는 이러한 층 구조를 모방하여 인공 신경망을 이루어 컴퓨터가 예를 통해 문제를 해결하는 방법을 학습하게 한다. 이를 위해 프로그램은 가상 신경망을 준비하여 이들 사이를 연결시키기 위해 가중치라고 부르는 임의의 절대 값을 부여한다. 가중치는 모의 신경이 디지털 특성에 응답하는 방식을 결정한다.

 

프로그래머들은 디지털 영상 또는 음파를 네트워크에 공급하여 이를 훈련시킨다. 데이터 속에서 패턴을 인식하는 방법을 학습하는 것이 목표이다. 네트워크가 특정한 패턴을 인식하지 못하면 알고리즘을 통해 가중치를 수정한다. 인공 신경의 단일 층이 정확하게 기본 특성을 인지하게 되면 이러한 특성은 신경의 다음 층에 공급되고 스스로 더욱 복잡한 특성들을 인지하도록 훈련한다. 이러한 과정은 시스템이 음파 또는 목적물을 확실하게 인지할 수 있을 때까지 연속적으로 반복된다.

 

예를 들어 첫 번째 신경층이 하나의 소리 단위를 인지하게 되면 이러한 소리 단위는 단어를 인지하기 위해 두 번째 신경층으로 흘러가 결합된다. 단어는 세 번째 신경층으로 흘러가 결합되어 구를 이루며 네 번째 층에서는 문장이 된다. 인공 신경네트워크는 방대한 훈련 데이터와 강력한 컴퓨터에 의존한다. 이 두 가지의 이용 가능성은 더욱 커지고 있다. 최근 몇 년 동안 딥러닝은 영상과 언어 인식 소프트웨어에 치중해왔다. 그리고 이러한 기술을 언어 통역에 이용하는 것이 타당한 진보이다.

 

더 나아진 이유

 

구글 딥러닝 번역 방식은 단어들을 벡터라고 부르는 가치값으로 변환하기 위해 16개의 프로세서를 이용한다. 벡터는 하나의 단어가 다른 단어와 얼마나 연관되어 있는지를 나타낸다. 영어와 프랑스어 사이에는 25억 개의 문장 쌍이 존재하며 영어와 중국에 사이에는 5억 개의 문장 쌍이 존재한다.

 

예를 들어 ‘신발’은 ‘피자’보다는 ‘양말’과 더 많이 연관되어 있다. 그리고 ‘버락 오바마’라는 이름은 ‘아르헨티나’보다는 ‘조지 부시’와 더 많이 연관되어 있다. 시스템은 투입되는 언어의 벡터를 이용하여 발생 가능성에 기초하여 순위가 매겨진 가능한 번역의 목록을 만들고 크로스체크를 통해 정확성을 향상시킨다. 번역시스템의 정확성을 향상시키는 가장 말도 안 되는 부분은 구글의 연구진이 신경네트워크 파워 시스템을 인간 설계자보다 더욱 독립적으로 만들었기 때문에 일어난다는 사실이다.

 

프로그래머는 최초의 자료를 공급한다. 그러나 그 이후 컴퓨터는 계층적 신경 네트워크를 이용하여 스스로 훈련한다. 이를 자율 학습(unsupervised learning)이라고 하며 이 방법은 프로그래머가 개입하는 감독 학습보다 더욱 효율적인 것으로 증명되었다. 이를 다른 말로 하면 마침내 컴퓨터가 인간보다 더 똑똑해진 것이다. 인간 번역가와 새로운 소프트웨어가 대결해본 결과 일부 언어에서는 컴퓨터가 인간보다 더욱 유창하게 번역해냈다. 구글은 이미 이 새로운 시스템을 중국어 영어 번역에 사용하고 있으며 현존하는 번역 기술을 신경망 번역시스템으로 완전히 대체하려는 계획을 가지고 있다.

 

딥러닝 소프트웨어가 하나의 언어에서 다른 언어로 문장을 정확하게 번역한다는 것만으로는 그다지 가치가 크지 않다. 왜냐하면 인간만이 완전히 파악할 수 있는 언어의 뉘앙스가 수없이 많기 때문이다. 모든 언어들은 속어와 구어적 표현을 가지고 있으며 이러한 단어들은 문화를 깊이 반영하고 있다. 관용구를 번역하려고 애쓰는 것은 때로 우스운 결과를 낳는다. 어떤 언어에는 있지만 다른 언어에는 없는 표현이 있으며 번역보다는 설명이 필요한 경우가 있다.

 

...이하전략

============

[추천도서]

인공지능 혁명 2030

- 제4차 산업혁명과 정치혁명의 부상

박영숙,벤 고르첼 공저 | 더블북 | 2016.09.28

http://blog.daum.net/bstaebst/18569

 

[책소개]

 

《유엔미래보고서》저자 박영숙 교수와 일반인공지능(AGI)협회장 벤 고르첼 박사의『인공지능 혁명 2030』. 이 책은 알파고 충격 이후 인공지능 혁명으로 새로운 부와 기회를 잡을 절호의 시기에 한국 독자들에게 인공지능에 대한 이해와 제4차 산업혁명이라는 새로운 도전에서 ‘기회’를 선점할 수 있는 ‘통찰’을 제시하고 인공지능이 바꿔놓을 새로운 세상의 모습을 상세하게 그린다.