스마트폰과 소셜네트워크의 확산으로 디지털 공간에서의 데이터 폭발이 현실화됨에 따라 빅데이터(big data)가 시대적 화두가 되고 있다. 최근 가트너, 맥킨지 등과 같은 세계적 컨설팅 그룹들은 빅데이터를 차세대 ICT 핵심 어젠다로 선정했으며, 글로벌 IT기업들도 빅데이터의 잠재적 가치에 주목하여 이를 효과적으로 분석·활용하는 역량 확보에 주력하고 있다.
기업 뿐만 아니라 공공영역에서도 빅데이터 활용 사례가 크게 늘고 있다. 특히 재난재해, 질병, 위기 등에 선제적으로 대처하기 위해 빅데이터 분석을 전략적으로 활용하려는 정책들이 크게 주목받고 있다. 이미 미국, 영국 등 주요국 정부들은 이미 빅데이터를 미래 ICT 전략의 중요한 전환점으로 삼고 관련 전문인력을 주요 정책영역에 적극 배치하고 있다.
그러면 우리나라 상황은 어떠한가?
이미 오라클, EMC, IBM, SAP, MS 등 몇몇 글로벌 IT기업들이 국내 업체 및 학계와 제휴하여 국내 빅데이터 시장 진출을 선언하면서 빅데이터 경쟁 무대가 형성되고 있다. 이에 질세라 국내 기업들도 글로벌 데이터 기업, 대형의료기관 등과 공동으로 비즈니스 시장분석, 유전자 정보 분석 등 빅데이터 사업에 뛰어들기 시작했다. 이러한 빅데이터 각축전 속에서 우리나라 정부도 지난해 11월 빅데이터를 활용한 스마트 정부 구현을 목표로 중장기 정책방향을 제시한 바 있다. 그야말로 빅데이터를 국가경쟁력의 핵심 자원으로 인식하기 시작한 셈이다.
최근 국내 빅데이터 시장에서 가장 활발하게 부각되는 것은 소셜분석 서비스이다. 예컨대 사이람, 다음소프트, 그루터 등과 같은 소셜분석 전문업체들은 소셜 빅데이터를 기반으로 마케팅 분석 뿐만 아니라 사회정치적 현상까지도 분석하는 서비스를 적극 제공하고 있다. 특히 선거와 같은 정치적 여론시장의 분석 수요가 크게 늘어남에 따라 올해 두 차례 선거가 ‘빅데이터 선거’가 될 것이라는 전망까지 나오기도 한다.
그런데 글로벌 기업들의 진출과 일부 소셜분석 서비스의 두각으로 국내 빅데이터 시장이 서서히 성장하고는 있지만, 빅데이터 시장을 주도할만큼 양질의 전문인력 및 연구역량을 체계적으로 확보하고 있지 못하다는 자성론이 제기된다. 하둡(Hadoop), 카산드라(Cassandra) 등 빅데이터 분석 기술들을 활용하는 서비스들이 점차 늘어나고는 있으나 그 데이터 결과를 제대로 읽고 해석하는 능력을 갖춘 국내 전문 인력은 여전히 부족하다는 것이다.
다량의 데이터를 단순히 수집·축적하는 것이 중요한 것이 아니라 구조화되지 않은 대규모 데이터 속에서 숨겨진 패턴을 찾아내고 여러 변수들을 통합적으로 고려하면서 창의적으로 해석할 수 있는 분석능력이 더 중요해지고 있다. 요즘 빅데이터와 관련해서 유행하는 용어인 ‘데이터 과학자(data scientist)’라고 불리는 연구역량이 필요하다는 뜻이다. 물론 빅데이터 연구역량은 통계물리학, 수학, 컴퓨터 과학, 소셜네트워크 분석과 같은 다양한 분석기법을 익혀야 하는 등 다년간의 개발과 훈련 기간이 요구된다는 점에서 단시일 내로 확보되기 어렵다.
그런 점에서 최근의 ‘빅데이터 신드롬’은 ICT와 관련한 교육 및 학계 차원의 인력양성 시스템에 대한 반성적 성찰을 근본적으로 요구한다고 하겠다. 단기적 성격의 특정 서비스에만 함몰되어 중장기적 연구와 개발에는 인색했던 것은 아닌지 반성할 필요가 있다는 것이다.
그나마 다행스런 것은 늦은 감이 있지만 공공 및 민간 차원의 빅데이터 활용서비스 모델을 개발하고 이를 체계적으로 연구하기 위한 "빅데이터 연구 및 활용센터" 설립 등의 중장기 계획이 방송통신위원회를 중심으로 활발하게 논의되고 있다는 점이다. 뿐만 아니라 카이스트 웹사이언스 학과 개설의 예에서 보듯이 최근 들어 빅데이터 분석인력을 양성하기 위한 정부차원의 교육지원이 적극 모색되고 있다는 점이다.
또 얼마전 ETRI가 IBM 연구소와 합작으로 수자원 관리, 스마트그리드 등에 빅데이터 분석을 적용하는 공동연구를 추진하는 것과 관련해서 ‘빅데이터 소프트웨어 연구소’를 개설한 것도 국내 빅데이터 연구역량 강화 및 데이터 생태계(data ecosystem) 형성의 중요한 계기가 될 것으로 기대한다.
필자는 국내 빅데이터 연구의 활성화를 위해서 크게 두가지 사항이 고려되었으면 하는 바램을 가진다. 먼저 빅데이터 분석과 활용이 인문사회 지식 기반의 학제적 접근에 의해 뒷받침되어야 한다는 점이다. 주지하다시피 구글, 애플 등은 빅데이터를 활용한 소셜 분석서비스에 인문학 전공자를 적극 투입한 바 있다. 일본에서도 이미 2005년부터 2011년까지 6년간 ‘정보폭발에 대비한 인프라스트럭처’라는 대규모 연구프로젝트가 추진된 바 있는데, 여기에는 컴퓨터 공학자 뿐만 아니라 인문사회과학자들도 대거 참여함으로써 ICT의 사회문화적 역기능 이슈에도 적극 대비하기도 했다.
뿐만 아니라 이용자 관점에서 빅데이터의 활용방안 연구가 더욱 강화되어야 한다는 점이다. 특히 빅데이터를 사용자 콘텐츠와 통합적으로 활용하기 위해서는 개인정보보호를 위한 기술 및 정책연구가 철저히 뒷받침되지 않으면 안된다. 예컨대 이용자의 데이터 주권(data sovereignty) 확보 차원에서 프라이버시 등 이용자의 기본권과 상충하지 않는 빅데이터 활용방안에 대한 법제도적 연구는 매우 중요한 과제라고 생각한다.
이원태 정보통신정책연구원 부연구위원
'시사정보 큐레이션 > ICT·녹색·BT·NT外' 카테고리의 다른 글
[MWC(모바일 월드 콩그레스)] 삼성전자 언제까지 웃을까? (0) | 2012.03.04 |
---|---|
카드사들 SNS 마케팅 '와글와글' (0) | 2012.03.02 |
[스크랩] [3월] 알쏭달쏭 - 정보 과잉의 시대, 우리에게 필요한 정보는 얼마나 될까? (0) | 2012.03.02 |
[스크랩] [3월] 당신의 이야기 - 빅데이터 시대의 인간 정보필터, 큐레이션 (0) | 2012.03.02 |
[스크랩] [3월] 당신의 뻔(fun)한 일상들 - 빅데이터, 실생활에서는 어떻게 활용될까? (0) | 2012.03.02 |