[IT기업 Data-Driven Decision Maker가 되기 위한 여정] ep2. 기여하는 데이터 분석가란?
이전 에피소드: [IT기업 Data-Driven Decision Maker가 되기 위한 여정] ep1. 카카오 추천팀 분석 인턴
섣부른 데이터 만능주의는 곤란합니다. 빅데이터를 모으기 어렵기 때문이 아니라, 데이터 자체는 100건이 모이든 100만 건이 모이든 아무런 통찰도 없기 때문입니다. 통찰은 오직 사람만이 할 수 있는 능력입니다. 따라서 데이터의 중요성이 부각될수록, 데이터를 보는 사람의 역량이 더욱 강조되어야 합니다. 지금은 오히려 그 어느 때보다 인간의 통찰이 중요해진 세상입니다. - 도서 ‘상상하지 말라’ 4장 중
제가 생각하는 기여하는 데이터 분석가라 함은, 방대한 데이터로부터 비즈니스에 도움되는 인사이트를 찾는 사람을 의미하는데요. 한마디로 통찰력이 있어야 한다고 요약해볼 수 있겠습니다. 그렇다면 통찰력을 얻기 위해선 어떻게 해야하는지를, 저는 저의 이전 경험들을 회고하고 관련 책들도 읽어보면서 고민하는 시간을 가졌는데요. 그 결과, 우선적으로 도메인
지식을 쌓고 관찰력
을 높일 필요가 있다는 결론에 이르렀습니다. 나아가, 그 통찰의 결과를 듣는 상대가 행동으로 옮길 수 있도록 전달력
을 높이는 것 또한 매우 중요하다고 생각하게 되었습니다. 이 세가지 역량들이 왜 중요한 의미를 가지는지 얘기해보려고 해요(☞゚ヮ゚)☞
도메인
저는 이전 에피소드에서 얘기한 추천팀 인턴을 하면서, 유저들의 방대한 로그 데이터를 접할 기회가 있었습니다. 이러한 데이터를 요리조리 열심히 보면 대단한걸 얻을 수 있지 않을까 생각했었는데요. 현실은 달랐고,, 저의 경우,, 말그대로 데이터의 홍수에서 허덕허덕 댔다고 할 수 있을 것 같습니다,,ㅎ 물론 실력 부족에는 다양한 원인이 있겠지만, 가장 큰 원인이 도메인 지식의 결여라고 생각되었습니다. 예를 들어, ‘유저들의 데이터가 이렇다!’라고 얘기했던 부분이, 알고보니 추천시스템에서 제어되어 나타난 자명한 결과이기도 했습니다. 물론 방금 예시는 시스템적인 부분들을 열심히 공부하고 나면 해결된 상황이겠지만, 인사이트의 깊이는 해당 분야에서 짬밥(?)이 많이 쌓일수록 더욱 깊어진다는 생각이 들었달까요..! 게임을 1도 안하는 분석가가 데이터를 통해 제안한 바가 사실상 게임을 많이 하는 사람들에겐 너무나 당연한 결과라거나, 분석가가 실무자에게 제안한 바가 실무자의 입장에선 “현업을 알면 제안할 수 없는 얘기입니ㄷ..” 라는 말이 나오거나 말이에요.
데이터 업계에는 궁극의 기술력을 지닌 사람이나 인문학적인 사고와 현장 경험인 도메인 지식을 가진 사람만이 남는 세상이 올 것이다. 통계나 모델링에서 자동화될 부분이 많아지면서, 결국 데이터를 자동화할 기술과 자동화된 데이터로 좋은 의사결정을 하는 사람만 남게 될 것이라는 말이다. 그렇다면 이제 중요한 것은 데이터로 어떤 의사결정을 하느냐다. 데이터를 보고 방향성을 어디로 잡고, 어떤 변화를 제언하는지가 데이터 분석의 최종적인 결과물이 될 것이다. 이 변화를 위한 핵심을 잡아내는 인력이 데이터 분석 역량을 가진 사람이라 볼 수 있다. - 도서 ‘데이터 쓰기의 기술’ 중
이러한 생각이 슬슬 들기는 했으나 막연하게 남아있던 가운데, 차현나 박사님의 책 ‘데이터 쓰기의 기술’에서 위 구절을 보게 되었습니다.
궁극의 기술력을 가진 모델러 및 엔지니어가 될 것인가? 아니면 도메인에 대해 깊이 이해하고 통찰력 있는 분석가가 될 것인가!
깜깜했던 부분이 조금은 선명해지면서, 저의 길은 후자라고 생각하게 되었습니다.
관찰력
도메인에 대한 이해도를 높였다면, 또 다른 중요한 역량이 바로 관찰력
이라 생각합니다. 특히 송길영 박사님의 책 ‘상상하지 말라’를 읽고 이러한 생각을 더욱 하게 되었는데요.
‘빅데이터’라는 단어는 한국 사회에서 (거의) 일상어로 쓰일만큼 익숙해졌습니다. 외려 한쪽에서는 과대 포장된 빅데이터 열풍을 경계하고, ‘이 또한 지나가리라’ 하며 한때의 유행처럼 생각하는 것 같습니다. 그러나 이는 어쩌면 ‘붓을 탓하는’ 마음 아닐까요. 데이터는 언제나 있었고, 사람이 이를 어떻게 활용할지에 따라 보고가 되기도 하고 쓰레기가 되기도 합니다. 중요한 것은 데이터를 어떤 눈으로 바라볼 것인가입니다. 아니, 굳이 복잡한 데이터를 고집할 필요가 없습니다. 일상을 잘 관찰하기만 해도 기회는 무수하게 찾을 수 있으니까요. - 도서 ‘상상하지 말라’ 프롤로그 중
생각해보면 데이터는 정말 언제나 어디에나 있었다는거에요. 데이터 분석이라는게 갑자기 생긴게 아니라는거죠! 세종대왕도 데이터를 활용했습니다. 새로운 세법인 공법 실시 전, 조선 총인구의 4분의 1에게 찬반 여론조사를 진행하여 찬성이 높은 지역 우선 실시 및 공법 수정을 진행하는 등, 정책 시행이라는 의사결정을 위해 데이터를 수집하고 활용했다고 합니다.
복잡한 데이터가 없어서, 팬시한 분석 기법을 몰라서, 쓸모있는 데이터 분석을 할 수 없는 것은 아니라는 생각이 들어요. 저는 통계학을 학사/석사 전공하고 파이썬을 열심히 써왔지만, 이러한 것들은 도구에 해당한달까요. 이제껏 도구를 열심히 갈고 닦아온 것 같아요ㅎㅎ 물론 좋은 도구가 있으면 유리하겠지만, 인사이트 발굴에 있어서는 도구를 탓할 게 아니라, 이보단 일상을 관찰하고 계속 궁금증을 가지는 태도가 필요한 것 같아요. 그 어떠한 복잡한 데이터보다, 일상에서의 Raw Data로부터 매출 하락의 조짐, 경제 위기의 조짐 등을 알아낼 수 있는 것처럼요.
최근 중고거래 앱에 골프 용품 관련 물건들이 유난히 많이 나왔다고 하는데요. 보통은 “아 그런갑다” 하겠지만, 관찰의 시선
으로 보면 “코로나때 호황을 찍었던 골프의 인기가 줄어들고 있다”는 것이 보이고, “그럼 이제 어떤걸로 옮겨가는걸까?”의 궁금증으로 이어지게 되죠. 바로 이런 ‘관찰의 시선’이 기여하는 데이터 분석을 위한 중요한 태도인 것 같아요.
전달력
충분한 도메인 지식, 예리한 관찰 등을 종합적으로 활용하여, 의미 있는 분석 결과를 얻었다고 합시다. 근데 사실 분석 결과를 얻고 끝나는게 목표는 아닐겁니다. 결국, “그래서 뭐?”까지 나아가야 할텐데요. 분석 결과를 통해 나아가야할 방향성을 제시한 후, 듣는 사람이 그걸 듣고 실제 행동으로 옮기는게 최종 목표일 겁니다. 행동으로까지 옮긴다는 것은, 매우 설득이 되어야 가능한 일일텐데요. 저는 “데이터 수치라는 반박불가 팩트가 있으면 당연히 설득되는거 아닌가?” 라고 생각했던 것 같아요ㅎㅎ 그런데 무조건 팩트와 논리만으로 효과적인 설득을 기대할 수는 없는 것 같더라구요..!
스토리 없이 그저 통계자료나 각종 데이터와 정보를 보았을 때, 10분 후 머릿속에는 정보의 5%밖에 남지 않는다. 기운 빠지는 일 아닌가? 특히 종일 숫자를 굴리는 직업에 종사하거나 자료를 수집하고 분석하는 일을 하는 사람이라면 더더욱 그럴 것이다. 물론, 빅데이터가 모든 것을 바꾸고 있지만 사람의 마음에 닿는 위대한 스토리가 없다면 고객과 클라이언트, 동료 직원은 그 내용을 잊는다. - 도서 ‘픽사 스토리텔링’ 중
효과적인 설득을 위해서는 바로 효과적인 스토리텔링
이 들어가야한다고 합니다. 문득, “아 내가 그동안 듣는 사람 입장을 충분히 생각 안해본 것 같다” 라는 생각이 들었어요. 제 나름 정리해서 설명했다고 생각했지만, 수치들만 계속 들이밀면 얼마나 재미없었을까?라는 생각이 들더라구요ㅋㅋ 스토리텔링해서 전달해야 집중도도 올라가고 기억에도 오래 남을텐데 말이죠.
차현나 박사님의 인터뷰에서도, “데이터를 분석해가면 의사결정권자가 얼마나 수용하나요. ‘설득력 있는’ 데이터 분석이 따로 있을까요.” 라는 질문에 다음과 같이 대답하셨습니다.
“숫자 그 자체보다는 스토리텔링이 의사 결정권자의 수용을 끌어내곤 합니다.”
정리하며
이러한 점들을 고려할 때, 나이팅게일이야말로 최고의 기여하는 데이터 분석가
가 아니었나 생각합니다.
1854년, 나이팅게일이 크림전쟁에서 간호사로 활동하던 당시, 병원이 매우 열악한 환경이었다고 합니다. 나이팅게일은, 이러한 불결한 막사와 시트를 관찰의 시선으로 보고, 불결한 환경이 병사의 사망에 영향을 끼치는것이 아닐지 의문을 가졌습니다. 2년간의 입원, 부상, 질병, 사망 데이터를 수집하여 확인한 결과, 전투보다 전염병 등 2차 감염으로 인한 사망이 더 많은 것을 알게 되었습니다. 따라서, 이러한 통계를 바탕으로 병원을 더욱 청결한 환경으로 바꿔야 한다고 주장하고자 했으나, 사람들이 통계를 쉽게 이해하지 못했다고 합니다. 따라서, 이를 시각화하여 사람들이 쉽게 이해하도록 하였고, 병원 위생의 중요성을 설득시켰습니다. 결국 5개월만에, 병원 내 군인 사망률이 42%에서 2%로 크게 감소하였다고 합니다. (출처: 통계청 블로그)
나이팅게일의 시각화 ‘로즈 다이어그램’
저 또한 이러한 역량들을 기억하며, 기여하는 데이터 분석가가 되고자 합니다. 이러한 생각의 과정을 통해 결정한, 저의 첫 커리어 시작을 다음 에피소드에서 말씀드리고자 합니다😀
Reference
- 도서 ‘상상하지 말라’, 송길영 저
- 도서 ‘데이터 쓰기의 기술’, 차현나 저
- 도서 ‘픽사 스토리텔링’, 매튜 륜 저
- [폴인인사이트]데이터사이언티스트 차현나 “데이터가 진짜로 일하게 하려면”
- 나이팅게일과 세종대왕의 공통점은? 통계 능력자와 알아보는 데이터 리터러시의 중요성
- 골프 호황 ‘종말의 징후’…”중고채가 쏟아지고 있다” [박동휘의 컨슈머 리포트]