2019.12.06. 14:00

기술 업계에서 지금 꺼낼 수 있는 가장 식상한 이야기를 하나 꼽으라면 단연코 ‘데이터의 중요성’을 강조하는 말이 아닐까? 하지만 그럼에도 데이터는 여전히 중요하다. 모든 데이터는 가치를 숨기고 있고, 그 의미를 발견하는 것으로 기존과 다른 무엇인가를 만들어 낼 수 있을 것이라는 기대가 있다.
4차 산업혁명, 디지털 트랜스포메이션 등 산업 현장의 새로운 고민거리도 이전에 없던 개념을 만들어 내는 것이 아니다. 데이터를 소중하게 여기고, 이를 효과적으로 가공∙분석해서 업무에 반영할 수 있는 시스템을 현장에 녹여내는 것이다.

‘데이터’라는 말이 실제 쓸모보다 마케팅 용도로 더 많이 쓰이다 보니, 그 영향력을 극대화하는 단어들이 엉뚱한 의미로 주목받는 경우가 많다. 현재 데이터의 의미가 가장 왜곡되는 단어는 ‘빅데이터’가 아닐까? ‘큰 데이터’라는 말은 아직 준비되지 않은 기업들에게 그 자체로 불안함을 불러일으키기 때문이다.

물론 빅데이터가 말 그대로 ‘큰 데이터’를 가리키는 것은 맞다. 문제는 데이터가 크다는 것이 으레 양적인 의미를 기대하게 한다는 점이다. 예를 들어 ‘전 국민의 의료 정보 데이터’나 ‘지난 10년간의 실시간 환율 변동 데이터’처럼 숫자 한두 개로 읽어낼 수 없는 막대한 양의 정보를 떠올리게 된다. 하지만 사실 이 정도로 명확하게 수집되는 데이터는 빅데이터의 범주에 넣을 필요가 없는 경우가 많다. 대부분 수치로 이뤄지는 정보들은 기존의 전통적인 데이터베이스로 충분히 처리할 수 있고, 심지어 날로 성능이 높아지는 PC에서 엑셀로도 처리할 수 있기 때문이다.

빅데이터에서 집중해야 하는 가치, 즉 ‘크다’의 의미는 기존 우리가 갖고 있는 데이터와 전혀 다른 형태의 정보들이 수집될 수 있다는 것이다. 단순히 숫자나 글자가 아니라 이미지, 영상, 소리를 비롯해 우리가 이제까지 데이터라고 생각하지 못해서 다루지 않았던, 또 기술적으로 다룰 수 없었던 것들이 ‘데이터’로서 가치를 가질 수 있는 가능성을 바라보는 것이 바로 빅데이터에서 놓치지 말아야 할 가치다.

그래서 새로운 형태의 데이터를 무작위로 담아둘 수 있는 파일 관리 시스템부터, 이를 효과적으로 처리하는 클라우드, 그리고 그 안에서 일어나는 미묘한 가치들을 읽어내는 인공지능 등 최신 IT 트렌드가 더해지면서 기술적, 사회적, 또 기업으로서는 경영, 영업, 마케팅 측면에서 의미를 찾을 수 있게 되는 것이다.

빅데이터 트렌드는 짧은 유행도 아니고, 윈도우나 엑셀처럼 소프트웨어 하나 구입해서 배울 수 있는 일도 아니다. 오랫동안 데이터를 다루고 데이터를 이해할 수 있어야 비로소 그 가치를 찾아낼 수 있다. 그래서 그 반대의 의미로 비춰지는 스몰데이터에 대한 관심이 늘어나고 있다.

 

사실 데이터의 의미는 아주 사소한 데에서 시작한다. 우리가 숨을 한 번 쉬고, 눈을 한 번 깜빡이는 것도 데이터다. 다만 그게 가치가 있느냐에 따라 데이터가 될 수도, 그렇지 않을 수도 있다. 데이터에서 의미를 읽어낼 수 있는 역량에 달린 셈이다.

특히 스몰데이터는 개인화에 대한 분석을 중심으로 한다. 스몰데이터의 사전적 의미는 ‘사람을 이해할 수 있을 만큼의 충분히 작은 데이터’다. 개개인이 어떤 관심사를 갖고 있고, 어떤 생활 패턴을 보이는지에 대한 데이터를 통해 개개인의 행동을 분석하는 것을 목표로 한다. 이 역시 빅데이터가 그랬던 것처럼 데이터의 직접적인 크기보다는 분석되는 대상을 좁힌다는 의미에 가깝다. 스몰데이터라고 해서 우습게 볼 수 있을 만큼 데이터의 양과 크기가 작기만 한 것은 아니기 때문이다.

코넬대학교는 작고 사소한 데이터를 기반으로 환자들의 건강 문제를 모니터링할 수 있는 방법을 고민했다. 단순히 환자들의 통증만이 질병을 판단할 수 있는 기준이 아니라는 점에 초점을 맞춰 온라인 식료품 구입 정보와 환자들의 상태를 매칭해 의미있는 정보를 얻어냈다. 식습관을 통해 인지 능력이나 피로, 약의 부작용, 수면 부족, 통증 등의 상관 관계를 찾아낸 것이다.

스몰데이터 역시 분석을 중심으로 하는 데이터 기술이다. 기술적으로 보면 전혀 새로운 개념은 아니다. 그 동안 개인화, 소비자 맞춤 서비스 등으로 고민하던 것이다. 이미 우리는 데이터를 개인화해 주는 서비스를 익숙하게 쓰고 있다. 바로 스마트폰이다. 구글은 안드로이드를 비롯해 여러 구글 서비스를 통해 이용자들의 행동 데이터를 수집, 분석하고 있다. 인터넷에서 어떤 정보를 검색하고, 어떤 주제에 관심을 갖고 있는지를 파악하는 것에서 시작해 이동 경로나 운동량, 누구와 e메일을 주고 받았는지, 오늘 어떤 비행기를 타고 어느 호텔에서 잘 계획을 갖고 있는지 등 셀 수 없을 만큼 많은 종류의 사소한 데이터들을 하나하나 수집한다.

기본적으로 구글은 이런 정보들을 수집해 개개인에게 더 정확한 맞춤 서비스를 제공하는 것을 목표로 한다. 개인화를 통해 서비스를 고도화하고, 이를 통해 검색 결과의 정확도를 높이는 것으로 서비스 이용자를 늘리는 순환 구조가 일어나는 것이다.

사람 한 명씩의 데이터를 분석하기 때문에 작아 보이지만 구글이 다루는 이용자 데이터는 수십 억 명 분이고, 그 종류와 양은 세상에서 가장 큰 빅데이터의 예이기도 하다. 빅데이터를 통해서는 사람들의 보편적인 관심사부터 전염병 정보, 선거 예측 등의 분석을 하는 반면 스몰데이터를 통해서는 쇼핑, 휴가, 건강 등의 개인 맞춤 서비스를 하는 것이라고 보면 된다.

특히 스몰데이터는 작은 습관을 바탕으로 사람을 이해하는 데에 초점이 맞춰지기 때문에 마케팅적인 의미를 읽어내기에도 유리한 기술로 꼽힌다. 날씨부터 문화적 규범, 종교와 정치적 상황 등이 기존의 범용적인 데이터 분석이 놓칠 수 있는 오차를 보완하고 극복할 수 있는 수단이 되는 데에 집중할 필요가 있다.

▲ 로에스푸드 매장

노스캐롤라이나에 본사가 있는 슈퍼마켓 로에스푸드(Lowes Foods)는 소비자들이 매장에 들어와 쇼핑하고 나가는 동안 만드는 사소한 데이터를 관찰해 구매 과정에서 보이는 반응, 상관관계를 통해 정서적으로 신뢰가 이뤄지는지를 판단하고, 그에 따르는 대응 방법을 찾아내고 있다. 각각의 상품과 서비스, 보상에 사람들이 어떻게 반응하는지를 판단하는 것이다. 빅데이터를 통해 데이터들이 만들어내는 상관 관계를 찾는 데 집중한다면 스몰데이터는 ‘왜 사람들이 그렇게 반응하는지’ 원인을 찾아낸다.

 

결국 빅데이터와 스몰데이터는 따로 움직이는 것이 아니라 어느 부분에서 데이터의 의미를 찾을 수 있느냐에 대한 관점 차이에 가깝다. 특히 데이터를 통해 마케팅 계획을 세우고자 하는 기업들 입장에서는 어느 한쪽도 소홀히 할 수 없는 부분이다. 이제까지 많은 기업들이 오랫동안 데이터 분석에 실패한 이유 역시 ERP, CRM 등 숫자를 단편적으로 해석하던 초기의 데이터 환경 때문일 것이다. 지금은 클라우드와 인공지능 등 도구와 기술이 발전하면서 데이터를 다각도로 분석할 수 있는 조건이 갖춰지고 있다.

하지만 막무가내로 데이터를 모두 모을 수는 없는 일이다. 데이터가 많아지면 그만큼 관리가 어려워질 뿐 아니라 적절한 사용도 쉽지 않다. 무엇보다 보관과 처리에 들어가는 비용이 기하급수적으로 늘어나게 마련이다. 또한 스몰데이터의 핵심인 대중들의 데이터를 모으는 일이 앞으로는 더 어려워진다. 단순히 사생활 정보를 떠나 의료 정보, 미성년자 데이터 등 법적인 규제가 더 까다로워지고 있다. 당연한 수순이다. 다만 그동안 사회적으로 데이터의 가치를 진지하게 인지하지 못했고, 공론화도 되지 않았을 뿐이다.

앞으로 데이터는 더 큰 의미를 갖게 될 것이다. 기존에 데이터화할 수 없다고 생각한 것들도 빅데이터 도구로 수집과 분석이 이뤄지고, 그 결과는 다시 스몰데이터들과 함께 현장에서, 또 이용자 가까이에서 가치를 만들어낼 것이다. 중요한 것은 데이터의 크기나 형태가 아니라 필요한 정보가 무엇인지에 대해 더 유연하게 생각하고, 그에 맞는 데이터를 차근차근 모아 나가는 것이다. 데이터는 원하는 결과를 결코 순순히 내어주지 않는다.

페이스북 트위터 URL 공유 인쇄 목록

소셜로그인 카카오 네이버