[일잘러스킬]데이터분석-Drill down 방식으로 분석하기

May 29, 2020 · 5 mins read

안녕하세요~!
프로이직러 Mara입니다.

지금까지 데이터 분석을 준비하는 과정을 한번 복습해볼까요?
문제를 정의 한 후 그에 맞게 데이터를 추출합니다. Raw data에 빠진 부분이 있다면 재가공해주고 가공한 데이터가 맞는지 내가 가진 상식과 회사의 KPI 지표, 피봇 테이블 등을 활용해서 크로스 체크를 하고 나면 비로소 데이터를 분석할 수 있는 준비가 됐다고 할 수 있습니다.

데이터 분석을 빠르게 하는 방법- Drill down

여러분 모래사장에서 바늘 찾기라는 말 들어보신 적 있으시죠? 모래사장에서 바늘을 찾으려면 어떤 방법이 있을까요?

  1. 마구잡이로 찾는다
  2. 모래사장을 구역을 나누고 바늘이 있을 법한 구역을 먼저 찾는다

누가 봐도 2번이 빠르겠죠? Mara가 생각하기에 데이터 분석도 비슷하다고 생각합니다. 해결하고 싶은 문제가 있고 그 문제가 일어난 원인을 찾으려면 데이터를 유의미한 기준으로 쪼개고 원인이 발생했을 가능성이 높은 데이터 부터 먼저 살펴보는거에요. 이것을 ‘위에서부터 쪼개가며 데이터를 본다’ 라는 의미로 Drill down 방식으로 접근하기라고 이름 붙여 봤어요. 그럼 데이터를 분석하는 순서에 대해서 알아볼까요? Mara가 생각하는 데이터 분석의 순서는 아래 4 Step을 거칩니다.

Step1. 데이터 추출 기준 보여주기

데이터에 대한 분석을 제시하기 전에 어떤 문제의식을 가지고 이 데이터 분석을 시작했는지, 데이터가 어떤 기준으로 추출되었고, 기간의 범위가 어디부터 어디까지인지 등 데이터 추출 기준을 한눈에 볼 수 있게 정리를 해서 알려주는 거죠. 특히 데이터에 기준에 대해 명확히 합의가 된 상태에서 데이터를 추출한 경우에는 이견이 없지만 데이터 분석가가 스스로 문제의식을 가지고 주관적인 판단하에 직접 데이터를 뽑았다면 데이터 추출 기준에 대해서 정리를 해줘야 데이터 해석에 오해의 소지를 줄일 수 있겠죠? Mara는 보통 데이터 추출 기준에 대해서 아래의 4가지 정보들을 정리하는데요, 경우에 따라서 더 필요한 내용을 자유롭게 추가하시면 됩니다. ~!

  • 해결하려고 했던 문제 데이터 분석을 통해서 해결하고자 했던 문제가 무엇인지 정의하고 그 내용에 따라 추출할 데이터도 결정합니다.
  • 데이터 추출 기간 문제에 대한 해결책을 찾기에 적합한 데이터 윈도를 선택해야 합니다.
  • 데이터 정의 사용하는 데이터의 정의를 밝혀줍니다.
  • 데이터 포함/불포함 기준 특정 기간 혹은 특정 데이터 속성에 왜곡이 발생해서 전체 성과를 왜곡시키는 경우 데이터를 불포함시킬 때, 기준에 대해 명시해주어야 합니다.

2019년 4분기 매체별 광고비 데이터를 취합해서 보고 한다고 가정했을 때 아래와 같이 적어볼 수 있을 것 같아요.

[예시]

  • 해결하려고 했던 문제 2019년 4분기 매체별 광고비 효율 측정을 통한 2020년도 1분기 매체 운영 계획 수립
  • 데이터 추출 기간 2019년 4분기(10월~12월)
  • 데이터 정의
    • 매체: Facebook, Google Ads, Affiliate(Cauly, Manplus, TNK)
    • CTR : Click / Impression
    • CVR : Install / Click
    • ROI : Return on Investment
    • Cost : 비용
    • Revenue : 광고를 통해 얻은 앱 내 구매액
  • 데이터 포함/불포함 기준 2019년 10월 첫째 주에 Facebook 광고 서버 이슈로 인해 Cost는 있는데 Revenue가 0 인 기간은 제외한다

Step2. 데이터 Top line을 읽습니다

전체 성과가 어떠했는지 살펴보는 것을 Mara는 ‘데이터 Top line을 읽는다’라고 표현했어요. 이때 중요한 것은 성과를 측정할 기준을 정하고 데이터를 읽어야 한다는 것입니다. 성과 측정 기준은 비즈니스 상황을 고려해서 적절한 기준을 잡으면 됩니다. 퍼포먼스 마케팅 팀에서 일하고 있는 Mara는 기본적으로 1번째 KPI를 ROI로 잡고 나머지 데이터를 함께 살펴보면서(CTR, CTI) 매체별 성과를 읽어줍니다.

이때 고려할 내용은 단순히 효율 지표만이 아니라 전체 성과에서 얼마만큼의 비중을 차지하고 있는지입니다. 만약 효율이 다른 매체 대비 뛰어나다고 하더라도 전체 비용에서 5% 정도 차지하고 있다면 해당 매체에 비용을 20% 까지 올렸을 때 성과가 어떻게 변할지 알 수 없는 거죠. 시도해 볼 수는 있지만 조심스럽게 접근해야 한다는 action plan이 나옵니다. 또 비용을 더 쓰고 싶어도 매체 트래픽에 제한이 있어서 쓸 수 없는 이슈(Scaleability)가 있을 수도 있고요.

Step3. 성과의 원인(Driver)을 찾는다

2에서 Topline성과를 통해서 우리 조직이 지금 마케팅 활동을 잘하고 있는지 못하고 있는지를 파악했습니다. 여기서 끝나면 안 되겠죠? 마케터라면 왜 이런 성과가 나왔는지 원인 파악을 해야 합니다. 어떤 성과든 간에 원인을 파악하는 방법은 동일합니다. 더 하위 Level로 데이터를 쪼개 보면서 왜 이러한 원인이 나왔는 지 살펴봅니다.

Driver를 찾는 가장 확실한 방법은 원인으로 추측되는 Driver 성과를 제외하고 성과를 재계산해보는 것입니다. 만약에 A 채널이 저성과의 원인인 것으로 추정된다고 했을 때 전체 성과와 A를 제외한 전체 성과를 비교해보는 거죠. A를 제외했더니 전체 성과가 크게 개선된다면 A 채널이 저성과의 원인이었다 라고 말할 수 있겠죠?

Step4. Recommendation 데이터 해석자의 주관적인 추천(중요)

저성과의 원인이 무엇인지까지 파악했다면 이를 기반으로 Action plan을 제시해야 합니다. A채널 성과의 예산을 타 채널로 옮긴다던가 타기팅을 재계산하는 등의 action plan을 제시하는 거죠. 가끔 숫자는 나노 단위로 drill down해서 분석해놓고 제안(suggestion)은 없는 경우가 있습니다. 보고 받는 부장님은 말씀하시겠죠.

“그래서 뭐? 어떻게 해야 하는 건데?”
데이터 분석을 하는 목적은 문제를 해결하는 것이지 숫자를 읽는 것에 있지 않으니까요. 데이터 분석 목적에 대한 Mara 글 보러가기

위의 step 1~4번까지의 과정을 반복하는 것이 데이터 분석의 한 cycle을 돌았다 라고 할 수 있겠습니다. 막막하고 어렵게 느껴졌던 데이터 분석에 많은 분들이 좀 더 쉽게 접근하셨으면 좋겠습니다.
오늘도 칼퇴하세요~! 🙋‍♀️


comments powered by Disqus