시사정보 큐레이션/ICT·녹색·BT·NT外

돈이 되는 정보 ‘빅데이터’ 분석…과학이 된 21세기 독심술

배셰태 2012. 9. 24. 10:43

[돈이 되는 정보 ‘빅데이터’]돈이 되는 ‘빅데이터’ 분석…과학이 된 21세기 독심술.

매경이코노미2012.09.24 (월)

 

국가정보요원이나 언론인이 정보를 온통 독점하던 시절이 있었다. 아날로그 시대에는 정보가 많지 않았고 이를 퍼뜨릴 만한 수단도 마땅치 않았기 때문이다. 그야말로 소소한 정보 하나하나가 소중했고 가치 있었다. 디지털 시대에서의 정보는 마치 모든 사람들이 공동으로 이용하는 공공재 같다. 정보의 양이 엄청날 뿐 아니라 유통 속도가 무척 빨라졌다.

 

앨빈 토플러가 1970년대 언급한 '정보의 홍수(Information Overload)'를 넘어 빅데이터(Big Data) 시대가 온 것이다. 정보의 가치는 활용하는 이에게 달렸다. 누구에게는 정보공해(Information Polution)가 되고 누구에게는 생각지도 못한 경영 노하우를 알려주는 보석이 된다.

 

그러나 기업 현장에선 빅데이터라는 용어의 개념조차 불분명하다. 빅데이터를 어떻게 활용해야 할지 우왕좌왕하는 모습도 보인다. 빅데이터가 무엇을 의미하는지, 빅데이터를 활용한 국내외 성공 사례는 어떤 게 있는지 조명해봤다.

 

<중략>


빅데이터의 키포인트는 분석(Analytics)

널브러진 데이터 묶어내는 게 핵심

 

지난해 전 세계에서 선보인 모든 음악을 저장하는 데 드는 비용이 얼마일까? 단돈 600달러다. 1테라바이트급 하드디스크 몇 개만 구입하면 전부 저장할 수 있다. 미국 뉴욕증권거래소는 하루 1테라바이트의 새로운 거래를 생성한다. 이는 100달러면 저장할 수 있는 수준이다. 이처럼 저장매체 값이 떨어지면서 데이터를 수집, 저장하고 처리하는 일은 비교적 간단해졌다.

 

빅데이터를 활용하는 절차는 기술적으로 '수집-저장-처리-분석-표현'의 5단계로 나뉘는데 이 중 핵심은 분석(analytics·애널리틱스)이다. 과거 마케팅 분석 기법으로 사용해왔던 데이터 마이닝은 분석의 기본 중 기본이다. 축적된 데이터(광산)에서 유용한 데이터(광물)를 추출한다는 의미에서 알 수 있듯, 정보 간의 연관성을 파악해 의사결정에 활용한다.

 

텍스트(text) 마이닝 기법이 중요하다. 빅데이터는 SNS의 댓글처럼 통일된 데이터가 아니라 아무렇게나 저장된 비정형 자료들이 많다. 이 때문에 사람들이 말하는 언어를 그대로 이해하는 기술이 활용된다. 예를 들어 '잘 잤니' '좋은 아침이야' '굿모닝'을 전부 아침인사로 분류해 처리하는 식이다. SNS 속 다양한 견해를 '긍정' '중립' '부정'의 3단계로 나누는 경우도 이에 해당된다. 이런 분석법을 오피니언(opinion) 마이닝이라고 한다. 연관성을 찾아내는 일도 주요 기술 중 하나다. 예를 들어 양파, 감자를 많이 산 소비자가 햄버거 고기를 같이 산 확률이 높다는 점을 파악해내는 것이다. 이를 통해 기존 고객 관리뿐 아니라 새롭게 고객이 될 수 있는 잠재층까지 발굴하는 게 목적이다.