[일잘러스킬]데이터검증허니팁1-상식으로 크로스체크하기

May 26, 2020 · 3 mins read

안녕하세요~!
프로이직러 Mara입니다.

이전 글에서 분석을 하기 전에 Raw data를 가공하는 작업들을 살펴보았는데요. 본격적인 분석을 시작 하기 전에 해줘야 할 작업이 한 가지 더 있습니다. 바로 가공된 데이터에 오류가 없는지 확인하는 크로스 체크를 하는 건데요. 그런데 크로스 체크는 왜 필요한 걸까요? Mara가 생각하는 이유는 아래 세 가지 입니다.

1.일을 2배로 하게 됩니다.

크로스 체크를 하지 않으면 잘못된 데이터를 바탕으로 분석을 하기 때문에 데이터 해석도 잘못 할 수 밖에 없고 잘못된 비즈니스 의사결정을 하게 됩니다. 정성껏 분석했더니 처음부터 다시 해야 되는 경우가 생기면 안되겠죠?

2. 다음 기회가 없을 수 있습니다.

회사는 처음부터 검증되지 않은 사람에게 높은 난이도의 업무를 주지 않습니다. 신입사원뿐 아니라 경력직도 어느정도 능력이 검증된 이후에야 난이도가 있는 업무를 할 수 있더라구요. 그런데 간단한 데이터 정리를 시켰더니 틀린 데이터를 전달 한다면 업무를 지시하는 사람 입장에선 다음 기회를 주기 싫겠죠. 성의가 없어보이기도 하구요.

3. 신뢰를 잃습니다.

모든 관계에서는 신뢰가 중요한 덕목일 텐데요. 직장 생활에서도 같이 일하는 동료와 상사에게 신뢰를 얻는 부분이 가장 중요한 것 같아요. “Mara에게 일을 맡기면 항상 숫자가 정확해! “라는 믿음이 있으면 일하기 참 쉽겠죠? 반면에 “Mara에게 일을 맡기면 그 숫자는 믿으면 안돼. 반드시 더블체크하고 써야 해.”라는 믿음(?)이 있다면 신뢰를 잃고 심각한 마이크로 매니징을 당할 수 있어요. Mara가 당해봐서 아는데 마이크로 매니징, 이거 생각보다 엄청 괴로운 일이거든요. 😑 매니저 레벨에 있는 사람들은 비즈니스 흐름을 꿰뚫고 있는 사람들이기 때문에 대충 봐도 데이터의 옳고 그름을 알 수 있어요. 이런 사람이 ‘이것 체크 했어요? 저것 체크했어요?’라고 파고들기 시작하면 그 게임은 (대부분) 백전백패입니다. 이런 괴로운 상황을 마주하기 전에 우리 꼭 크로스 체크하자고요.

데이터 검증 🍯Tip1. 상식으로 크로스체크하기

자, 그럼 데이터 크로스 체크는 어떻게 하면 좋을까요? 우선적으로는 데이터를 가공한 뒤 그 숫자를 한번씩 음미해봅니다. 음미한다는 것은 이 데이터가 의미하는 바가 무엇인지를 한번 곰곰히 생각해보는 거죠. 그렇게 데이터를 보다 보면 어떤 데이터는 상식적으로 말이 되지 않는 경우가 있습니다. 예를 들어 ROI라는 지표가 있습니다. Return on Investment 의 약자, 말 그대로 투자 비용 대비 수익을 뜻하는 지표인데요. ‘ROI가 1 이상이면 100만 원의 비용을 썼을 때 100만 원만큼의 수익을 창출했다.’라고 말할 수 있는 거죠. 비즈니스마다 평균적인 ROI는 모두 다르기 때문에 ‘ROI는 얼마야’라는 정답은 없습니다. 하지만 ROI가 20이 나왔다고 하면 어떨까요? 100만 원의 비용을 썼는데 2,000만 원의 수익으로 돌아온 거죠. 사실이라면 대박 비즈니스 모델을 찾은 거겠지만 데이터가 틀리지 않았을까?라는 의심도 해볼 수 있겠죠.

상식에 근거한 데이터 크로스체크는 본인이 가진 상식선에서 해당 데이터가 말이 되는 지 안되는지 판단해볼 수도 있지만 좀 더 정확한 근거를 찾고 싶다면 관련 통계 자료를 검색하거나 구글링으로 레퍼런스 삼을 만한 데이터를 검색해서 비교를 해봐도 됩니다. 특히 기본적인 인구 통계 데이터는 데이터가 가지는 의미를 조금만 음미해보면 누구나 알 수 있는 상식적인 데이터이기 때문에 모든 데이터는 ‘정말 이 데이터가 말이 되나?’라는 합리적인 의심을 하는 습관을 가질 수 있도록 연습을 하는 게 중요한 것 같아요.

이번 글에서는 데이터 크로스 체크를 해야 하는 이유와 크로스 체크하는 꿀팁에 대해서 알아봤습니다. 다음 글에서도 Mara의 데이터 검증 🍯Tip 방출해볼게요. 기대해주세요~!
오늘도 칼퇴하세요~! 🙋‍♀️


comments powered by Disqus