시사정보 큐레이션/국내외 사회변동外(1)

[로봇 저널리즘의 탄생] 뉴스를 조립하라, 로봇기자 시대

배셰태 2014. 7. 1. 22:14
[궁금한 화요일] 뉴스를 조립하라, 로봇기자 시대

중앙일보 2014 07.01(화) 강정수 (사)오픈넷 이사

 

로봇 저널리즘의 탄생
미 대학생 4명이 만든 '스탯 몽키'
잘게 쪼갠 문장에 데이터 더해 … 기사 형식 정하면 자동으로 생산
LA타임스·포브스 등 이미 활용, 올 3억 개 기사 생산·판매 예측
일부선 "여론 조작 가능" 반발도

 

2014년 로봇이 세계 산업계 및 학계의 화두로 다시 등장했다. 로봇이 육체 노동뿐만 아니라 지식 노동까지 대체하려고 한다. 대표적으로 기사 생산을 로봇이 맡기 시작하고 있다. 미국 LA타임스는 속보를, 보스턴글로브는 스포츠 기사를, 포브스는 금융시장 기사를 로봇 기자에게 맡기고 있다.

 

특히 지난 3월 17일(현지시간) LA타임스가 LA 인근의 지진을 발생 8분 만에 로봇 기자의 기사로 빠르게 보도한 것은 세계 언론의 주목을 받았다. 영국 가디언은 2013년 11월 종이 신문을 사람 아닌 알고리즘의 편집으로 생산하는 프로젝트를 시작했다.

 

‘길지만 좋은 읽을거리(The Long Good Read)’라는 이름의 알고리즘에 의해 자동 생산되는 주간신문은, 가디언 뉴스사이트에서 길이가 긴 기사를 댓글·SNS 공유 등의 기준에 따라 선별한 후 자동 편집해 24쪽의 타블로이드 판형으로 인쇄한 종이신문이다. 사람의 편집을 거치지 않은 최초의 종이신문이다. 이른바 ‘로봇 저널리즘’ 혹은 ‘알고리즘 저널리즘’의 등장이다.


▷여기를 누르시면 크게 보실 수 있습니다


#로봇 기자의 등장

 

=로봇 저널리즘이란 기사를 자동으로 생성하는 소프트웨어에 기반을 둔 저널리즘을 말한다. 개념은 이렇다. 인터넷에 스포츠 및 증권시장 기사가 셀 수 없이 많다. 그중 프로야구 경기 기사를 최소 단위까지 쪼개서 분석하다 보면 일정한 패턴을 도출할 수 있다. 선수들의 역할과 게임 규칙, 선수들의 행위를 표현하는 야구용어, 이를 전달하는 기사의 문장 표현에 들어간 부사·형용사·동사 등. 이에 대한 수많은 기록을 정리하면 프로야구 기사를 구성하는 문장 하나하나를 도식화할 수 있다. 이렇게 패턴화된 문장에 구체적인 경기 내용을, 작은 데이터로 구별해 입력하면 스포츠 기사가 탄생한다는 것이다.

출발은 2009년 4월 미국 노스웨스턴대 저널리즘학과와 컴퓨터공학과 학생 4명이 시작했다. 한 수업에서 조별 연구과제를 작성하기 위해 뭉친 이들이었다. 당시 협업 연구과제는 디지털 뉴스시장의 확대에 따라 지역 언론사가 겪고 있는 문제를 정의하고 그 해결책을 제시하는 것이었다. 점점 더 많은 사람이 종이 매체보다 온라인에서 정보를 얻고 있다. 기자들은 마감 시간이 따로 없이 계속해 터지는 이슈와 사건을 속보로 전해야 하는 온라인 뉴스 생산 방식에 힘겹게 적응하는 중이다.

로봇 편집장이 만든 가디언의 주간지 가디언의 주간신문 ‘더 롱 굿 리드’. 가디언 온라인 기사 중 호평받은 것을 로봇이 자동으로 선택하고 편집해 타블로이드 판형으로 인쇄했다.

 

이들은 기자들의 노동 강도가 높아지는 가운데 단순 노동을 줄여 그들이 좀 더 가치 있는 일에 집중하도록 돕자는 데 뜻을 모았다. 그렇게 개발한 ‘스탯 몽키(Stats Monkey:통계를 자동 처리하는 원숭이)’라는 알고리즘은 지역 리그 야구경기에 대한 기사를 자동으로 생산하는 기능을 가졌다. 이들의 포부는 단순했다. 스탯 몽키를 활용해 매일매일 진행되는 야구경기를 요약하는 기사 생산은 컴퓨터에 맡기고, 대신 기자들은 분석 기사와 인터뷰 등 좀 더 깊이 있는 기사 생산에 집중할 수 있는 시간적 여유를 갖게 하자는 것이다.

#로봇 저널리즘의 확대

 

=이들은 2010년 스탯몽키 기술을 상업화하기 위해 ‘내러티브 사이언스(Narrative Science)’라는 이름의 뉴스 벤처를 창업한다. 2012년 40만 개의 스포츠 기사, 2013년 150만 개의 스포츠 기사를 생산한 내러티브 사이언스는 2014년 들어 로봇 기사 생산영역을 금융시장 기사로 확대했다. 생산력도 크게 증대해 2014년 총 3억 개가 넘는 기사를 생산 및 판매할 것으로 보인다. 또 초당 10개의 기사를 쏟아내는, 빠른 생산 속도도 자랑하고 있다. 포브스는 아예 내러티브 사이언스가 제공하는 금융기사 코너를 따로 두고 있다.


내러티브 사이언스의 CTO 해먼드는 2011년 뉴욕타임스와의 인터뷰에서 “20년 안에 내러티브 사이언스의 로봇이 퓰리처상을 받을 수 있을 것”이라며 로봇 저널리즘이 생산 속도뿐 아니라 품질에 있어서도 인간 기자를 압도할 날이 곧 올 것으로 전망한 바 있다.

더욱 흥미로운 점은 2013년 미국 중앙정보국(CIA)이 내러티브 사이언스에 적지 않은 규모의 투자를 진행했다는 사실이다. 기사를 자동으로 생산하는 알고리즘에서 수많은 보고문서를 요약 정리하는 가능성을 보았기 때문이다. 독일 정보국(BND) 또한 유사 기술을 가지고 있는 엑세아(Aexea)에 투자하고 있다. 엑세아는 로봇에 의해 생산된 스포츠 기사 및 날씨 기사를 개당 1유로에 판매하는 독일 기업이다.

 

#로봇 기자에 대한 우려

 

=로봇에 의한 기사 생산이 대학 연구 프로젝트에서 산업화 수준에 이르자 이에 대한 저항 또한 서서히 생겨나고 있다. 2013년까지 로봇 저널리즘에 대한 다수 언론의 반응은 그 가능성에 대한 의심과 두려움이었다. 그러나 로봇 저널리즘의 상업화 수준이 빠르게 진행되고, 기사 대체 영역이 스포츠에서 금융 및 날씨로 확대되자 이에 대한 반대 목소리도 커지고 있다. 로봇이 특정 소재의 수많은 기사를 짧은 시간 안에 인위적으로 생산할 경우 이와 관련된 여론이 조작될 수 있기 때문이다. 독자가 인간 또는 로봇이 생산한 기사를 구별할 수 있도록 생산 주체를 표시해야 한다는 목소리도 힘을 얻고 있다. 그러나 로봇 저널리즘에 대한 여러 우려에도 불구하고 기자의 지식노동을 대체하는 수준까지 알고리즘 기술이 걷잡을 수 없는 속도로 진화하고 있음은 분명하다. 기자를 대체하는 로봇이 몰려오고 있다.

강정수 (사)오픈넷 이사 berlinlog@gmail.com

연세대 독문학과를 졸업하고, 독일 비텐대에서 경영학 박사학위를 받았다. 오픈넷은 인터넷의 자유와 개방을 촉진하는 비영리 법인이다.