본문 바로가기
A카테고리

책 <데이터 읽기의 기술> 방법과 기술

by 꿈꾸는 금조 2023. 9. 1.

1. 데이터가 알려주는 소비자의 마음

우리가 데이터를 모으는 이유는 돈을 벌기 위해서 과거의 데이터를 모아두고 분석하는 것이다. 이 전 소비자의 해동을 데이터화 해서 예측할 수 있다면 정확한 수치는 아닐지라도 어느 정도는 매출을 자부한다고 볼 수 있기 때문이다. 오프라인 매장이라면 외부적인 데이터와 내부적인 데이터, 온라인 마켓이라면 유입과 전환, 클릭의 데이터 등 많은 데이터의 종류가 있기 때문에 단편적으로 매출, 또는 광고매출로 마진만 확인하기에는 한계가 있다. 때문에 소비자가 어떤 상황에, 어느 날씨에, 어떤 기온에, 어느 날에, 평일 혹은 주말에, 누구와 함께 와서 어떤 상품을 선택했는지 등의 여러 데이터로 집계될 수 있다. 시대가 변하고 온라인으로 모든 물건을 구매할 수 있는 세상이 되었지만 그만큼 온라인에서도 경쟁이 치열하다. 최근 10년간 소비자들은 절차가 복잡하면 그 과정에서 구매할 확률이 급격히 낮아진다는 데이터가 있기 때문에 간편인증, 간편결제의 서비스가 많은 발전을 이루어 왔다. 이제는 많은 업체가 이러한 서비스를 시행중에 있기 때문에 자사의 멤버십을 만들거나 포인를 지급해 소비자의 마음을 한 번 이라도 더 돌릴 수 있는 마케팅 기법을 사용한다.

 

2. 소비자의 마음은 가끔 거짓말을 한다.

가끔 소비자들은 자신도 모르게 거짓말을 한다. 이에 대한 대표적인 사례가 설문조사를 예로 들 수 있다. 불특정 다수 100명 에게 하나의 상품으로 설문조사를 진행했다고 가정을 했을 때, 긍정적인 평으로 70표가 들어가면 전 국민을 대상으로 했을 때 100명중 70명에 근사한 값을 낼 수 있을까?, 그렇지 않다. 또 하나의 예를 들자면 초고속 인터넷이 들어오기 전 진행했던 설문조사다. "초고속 인터넷이 생긴다면, 집에 설치할 용의가 있나요?"에 대한 조사에 절반이 넘는 사람이 "설치하지 않겠다."라고 답을 했다. 하지만 현재로 보면 대부분의 가정에서 초고속 인터넷을 사용한다. 이렇게 보면 소비자들은 거짓말을 한 셈이다. 그러나 당시 소비자들은 초고속 인터넷이 무엇인지조차 잘 몰랐을 것이다. 무엇이 좋은지, 무엇이 나쁜지 심지어 그게 무엇인지도 정확히 알지 못하는데 소비자가 제대로 답변할 수 있을리 없다. 이때 만약 사용하겠다는 소비자가 없으니 인터넷 사업을 중단하는 방향으로 진행됐다면 지금의 세계적인 디지털 망은 존재하지 않았을 것이다. 이 이야기를 한 이유는 "사람들은 보여주기 전 까지 자신들이 원하는 것이 무엇인지 모른다."라는 것을 알려주고 싶어서이다.

 

3. 많기만 하면 빅 데이터일까

대기업 연구소에서는 설문자의 수가 많으면 많을 수록 더 정확한 답을 추려낼 수 있다는 사람을 많이 만난다. 하지만 이는 반은 맞고 반은 틀렸다. 꼭 많은 사람을 대상으로 모은 데이터가 좋은 데이터는 아니다. 오히려 수가 많으면 많을수록 그룹의 특성이 사라질 수 있기 때문이다. 전 국민을 대상으로 하는 경우가 아니라면 수만 명을 대상으로 하든, 수십만 명을 대상으로 하든 큰 차이가 없는 경우가 많다. 설문조사도 결국에는 샘플과 같다. 건강 검진을 할 때 혈액 검사로 다수의 건강 지표를 확인한다. 그때 모든 국민의 혈액을 다 뽑아서 검사하지는 않는다. 팔과 다리에서 뽑은 피가 다르다고 보기도 쉽지 않다. 데이터도 마찬가지다 물론 어느 경우에도 전체 의견을 대변하지 못하고 틀릴 수 있다. 그렇지만 단순히 "전체가 아닌 적은 수를 대상으로 했기 때문에 믿을 수 없다"라고 말하는 것은 그냥 오해에 불과하다. 빅 데이터라고 부르는 이유는 데이터가 커서, 많은 사람으로 설문 조사를 해서 그렇게 불리는 것이 아니다. 그 결과를 다른 데이터와 연결하고, 분석해서, 데이터의 목적인 소비자 이해에 도달했을 때 그 빛을 볼 수 있고, 그것을 빅 데이터라고 부르는 것이다.