데이터 쓰기의 기술
서론
내가 왜 데이터분석을 배우고 싶었는지 생각해보았다.
데이터를 읽는 법을 안다면 내가 무언가를 주장할 때 명확한 근거가 되어줄 것이라고 생각했다.
데이터 분석을 잘 하기위해 파이썬을 배우고 sql을 배웠지만 막상 프로젝트에 적용하려고 하니 어려움을 느꼈다.
이 많은 숫자들을 어떻게 보아야 하고 어떻게 문제를 정의하고 해결해야될지 막막하다.
이 책을 통해서 업무를 할 때 실무자들은 어떤 시각에서 문제를 정의하고 답을 찾아가는지 배우고자 한다.
본론
1. 데이터 디자인
1) 질문하기
프로젝트를 시작할 때 그들이 무엇을 궁금해하고 어떤 점을 어려워하는지 듣기 위해서 이 프로젝트에 연결된 기존 자료를 찾고 관련된 사람들을 인터뷰한다. 시작할 때는 뭘 알고 뭘 모르는지 모르기 때문에 과거의 자료나 일반 수치부터 찾아보기도 한다. 그중에 특이하게 튀는 구간들을 찾고 의문을 가진다.
2) 문장 쪼개기
문장을 쪼갠다는 것은 머릿속에 떠오르는 질문을 데이터 단위로 분해하는 것이다.
ex) 요즘 잘 나가는 00마켓이 있어. 거기서 다른 데보다 저렴하게 팔더라고.
=> 요즘의 기간은 언제지? 몇 년, 몇 달, 혹은 몇 주나 며칠로 표현할 수 있을까?
/ 잘나간다는 기준은 무엇이지? 매출규모? 매출순위? 매출 성장률? 어느 집단에서 잘 나간다는 것이지? 한국? 특정 연령층? / 다른 곳은 어디지?/ 저렴의 기준은 뭐지? 평균? 전세계 비교 가격 중에 가장 싼가? 온라인, 오프라인 최저가?
3) 데이터 찾기
쪼개진 단어별로 데이터를 찾아야 한다. 기대한 데이터가 전부 있지 않고, 생각보다 데이터가 없는 경우가 많다.
4) 데이터 분석하기
큰 관점부터 작게 시작해야 한다.
우선 큰 관점을 세우려면 데이터 중 가장 구하기 쉽고 전체를 조망할 수 있는 숫자를 펼쳐본다.
ex) 일별 매출, 월별 매출, 연간 매출, 시간별 매출 등의 숫자를 시간 순서에 따라 라인 차트 등으로 만들어보자.
누적값으로도 그려보고, 증감으로도 그려보자
보통 기업에서 문제의식의 시작은 매출이 떨어졌다거나 원하는 매출이 나오지 않았다는 것이다. 매출이 어느 시점부터 기대보다 떨어졌는지 확인해야 한다. 그 시점을 확인하면 그 시점이나 이전에 일어난 다른 일들 혹은 연계 분석할 수 있는 실마리를 얻게 된다.
2. 데이터 스토리텔링
1) 데이터 퍼즐 맞추기
사람들은 데이터를 활용해 하나의 분석에서 엄청난 인사이트를 발견하기를 원하지만 그렇지 못하다.
여러 단위의 분석을 진행한 뒤에, 그 분석을 이어 이야기를 먼저 만들어본다. 이야기를 만들어가면서 미처 생각하지 못한 점, 변화를 이끌어낼 지점을 찾아내는 연습을 해야 한다. 그러기 위해서는 일단 다양한 분석 재료가 있어야 한다. 분석을 통해 하나의 차트/수식을 얻은 뒤 다양한 분석을 이어나가야 한다. 종합적인 분석 결과를 가지고 인사이트를 말할 수 있어야 한다.
낱개의 분석을 진행했다면, 이제 분석결과를 분류한다. 프로젝트 초기에 문장을 쪼개고 분석 기획을 하면서 커다란 분석 흐름을 잡아보았을 것이다. 이 낱개의 분석 결과 중 비슷한 것, 흐름상 인접한 곳에 놓여야 하는 것을 분류해야 한다.
그 후에는 분류한 내용을 재배열한다. 이 낱개의 분석들이 가리키는 방향은 무엇인가? 이 분석 내용과 저 분석 내용은 서로 상충되는데, 잘못된 것은 없는가? 둘 다 틀렸다면 어떤 조건이 달라서 이런 일이 일어났는가? 우리회사, 내 사업에 필요한 내용은 무엇인가? 이런 생각이 정리되도록 분석 결과를 재배열한다.
너무 어렵게 느껴진다면 1단계에서 진행했던 문장쪼개기로 돌아가서 자신이 처음에 했던 질문에 답을 해나가는 형식으로 이야기를 만들어본다. 처음에 질문했던 문장들에 대한 답을 육하원칙에 따라 정리해보면 도움이 된다. 퍼즐을 맞추다보면 반드시 빈 부분이 보인다. 이때 추가 분석을 진행한다.
조심해야 될 점은 질문에 답을 하다보면 어디서 끝내야 될지 모르고 숫자에 잠식된다. 그렇기 때문에 기한 안에 할 수 있는 질문과 답의 단위로 한계를 정해주어야 한다. 중요한 것은 데이터에서 얻은 인사이트를 배경으로 시장의 변화를 이끌어내는 액션을 실행하는 것이라는 점을 잊지 말자.
2) 변화를 만들 제언하기
자신이 하는 의사결정이 어떤 의미인지 제대로 알고 확신하는 것이 중요하다.
자신이 데이터를 기반으로 이해를 하고, 자기 의사결정에 확신을 갖기 위해 데이터를 본다고 해도 과언이 아니다.
데이터 제언을 한다는 것은 너무 두루뭉술해서도 안 되고, 너무 지엽적이거나 현장의 전문성을 침해해서도 안 된다.
그러면서도 현장의 변화를 가져올 만한 구체적인 제언을 한다는 것은 정말 어려운 일이다.
3) 데이터에 옷 입히기
데이터를 공유하는 방법 중 기업이 사용하는 흔한 방법으로는 데이터 자체를 공유하는 것이다.
반복적으로 확인 가능한 데이터는 단순 추출보다는 대시보드를 적극 활용
3. 데이터 기반의 의사결정
1) 액션 아이템 만들기
구체적이고 실현 가능한 플랜을 만든다.
2) 현장의 변화만들기
시장에 실제로 적용하고 데이터화 한다.
3) 소비자의 반응 포착하기
성과를 검증하고 성장 동력으로 삼는다.
기획 의도에 대한 측정방법도 미리 기획해 놓는 것이 좋다.
매출 분석은 결국 그 돈을 지불한 소비자에 대한 이해가 근본이 되어야 한다.
성과를 리뷰할 때 주요내용은 실적을 기본으로 하되, 애초에 기획했던 내용에 대한 검증이 추가 되어야 한다.
결론
나는 문제정의와 문제해결능력의 중요성은 알았지만 구체적으로 어떻게 해야 좋은 문제해결 능력인지 알지 못했다.
'문장쪼개기를 한 뒤 그에 맞는 답변을 분석한 것들을 토대로 답변한다는 것을 배웠다.
내가 분석할 때에는 무조건 답이 있는 것을 찾아야 된다는 생각에 가득차서 정작 문제정의는 등한시 되었던 것 같다.
다음 분석을 할 때에는 문제정의를 한 뒤 구체적으로 문장쪼개기를 해서 내가 무엇을 분석할 때 봐야할지 적용해 보아야겠다. 이런 방식에 익숙해진다면 회사에 가서도 의사결정자들이 무엇을 원하는지 읽고 그에 맞는 분석을 해서 문제해결을 할 수 있는 능력을 갖출 수 있을 것이다.