독후 활동

데이터 문해력_2403

기획자 에이든 2024. 3. 18. 20:31

요즘 가장 큰 고민 중 하나는 “데이터 분석 역량을 어떻게 향상시킬 수 있을까”였다. 내게 데이터 분석이란, SQL이나 파이썬 등을 활용해 어떻게 데이터를 봐야 할까? 였다. 이와 관해 관점이 바뀐 계기가 하나 있는데 기획자 톡방에서 “야메군”이라는 선배님의 이야기 덕분이었다.

  • (야메군의) 데이터 분석이란?
    - 분석의 개념을 이해하셔야 하는데요, 분석이란 문제현상 확인 - 데이터 추출 - 해석(시각화) - 해결방법 도출까지의 수행입니다.데이터가 고객 데이터만 있는 건 아니잖아요? 뉴스 검색만 해도 온갖 통계자료가 있으니 그러한 자료를 바탕으로 경험삼아 스터디를 해보시는 것도 좋을 것 같아요문제를 인식했으면 이제 가설에 근거해서 그 원인을 찾아야 하는 거잖아요?배불러 - 왜 배가 불러?(의문) - 방금 밥을 먹어서(가설) - 맞아! 방금 밥을 먹었지!(검증) 이 과정이 문제현상의 정의예요.데이터 추출은 개발자에게 맡기고 시각화는 디자이너에게 맡기세요 기획자는 문제를 파악하는 것에 올인해야 합니다.
  • 요기까지가 분석의 반. 나머지 반이 문제에 대한 해결방안 제시 입니다.
  • 이게 다 상업교육기관들이 데이터 분석을 이상하게 꼬아놔서 그래요.
  • 몇년 전부터 10대의 아이폰 편중이 심화되고 있다는 기사가 많이 나오고 있죠? 연도 별 점유비는 어떻게 되는지, 왜 그런 현상이 벌어지는지.. 어떻게 그 문제를 해결할 수 있는지 이런 걸 포트폴리오에 담아봐요.
  • 파이썬을 배웠다.. 이건 데이터 추출만 떼놓고 보는 건데요. 이것만으로는 데이터 분석이라 할 순 없어요ㅋ

그래서 데이터 리터리시(문해력)에 관심을 가지게 되었고 툴을 쓰는 것보다 데이터 안에서 어떤 의미를 읽어낼 것인가가 중요한 포인트라고 생각하게 되었다. 하지만 그마저도 책의 저자는 부정한다. 카시와기 요시키는 데이터 문해력을 이렇게 정의한다.

“데이터 문해력이란, ‘데이터에서 무언가를 읽어내는 능력’이 아니라 ‘스스로 정답에 대해 고민하고 데이터를 무기 삼아 합리적으로 논할 수 있는 능력’이라고 생각합니다.”

 

책의 전반에 걸쳐 저자는 데이터 안에는 정답이 없다고 이야기 한다. 우리는(특히 IT 계열) 흔히 “데이터 중심 사고”를 중요하게 생각하지만, 그는 데이터가 아닌 목적 중심 사고가 우선되어야 한다고 주장하며 그 근거와 사례를 펼쳐 나간다.

  1. 목적 없이 (우연히) 획득한 데이터로는 시야의 한계가 생긴다는 점
  2. 문제, 원인, 해결방안이 혼재하는 이상 명확한 분석이 이루어질 수 없다는 점
  3. 데이터를 정리하는 것에서 그치는 것이 아니라 그로부터 행동을 이끌어 내야 한다는 점

저자가 이야기 하는 데이터 활용 프로세스는 아래와 같다

  • 데이터 활용에 실패하는 이유
    1. 풀고자 하는 문제가 명확하지 않다
    2. 정의한 문제와 사용하는 데이터가 일치하지 않는다
  • 가장 먼저 해야 하는 작업은 ‘목적과 문제에 대한 정의’
  • 지금 생각하고 있는 것은 문제인가 원인인가 해결 방안인가
  • 데이터 → 가설이 아니라 가설 → 데이터
  • 왜(원인)인지 끈질기게 생각할 것
  • 목적/문제 정의 → 현상 파악/평가 → 원인 분석 → 해결 방안 위 프로세스에서 원인 분석 없이 현상만 보고 해결 방안으로 가진 않았나?
  • 데이터를 활용한다는 건 결과가 아니라 결론을 도출한다는 것
  • 정답은 없을 수도 하나일 수도 복수일 수도 있다
  • 분석 방법에 관한 TIP
    • 상관 계수를 활용해보기
    • 산포도에 따른 유형 분석
    • 평균 뿐만 아니라 분포의 상태도 확인할 것
      • 표준 편차는 보았는가?
    • 절대적 수치(규모)로 나타나지 않는다면 비율로 볼 것
  • 데이터 수집이 어려운 경우엔 어떻게 해야 하나?
    1. 유사한 데이터에는 어떤 것이 있을지 생각해본다(정확도는 약간 떨어지더라도, 데이터가 없는 것보다는 앗다).
    2. 지금 바로 수집을 시작한다(시간적인 여유가 있는 상태이고, 본질적인 데이터가 필요하다면).
    3. 정량적이 아닌 정성적인 정보로 대응한다(설문조사 응답 및 청취 다표 등).
    4. 포기한다(해당 부분은 본인의 가정을 통해 보완).

책을 통해 저자는 분석보다는 어떻게 활용할지가 결과보다는 어떤 결론을 낼 것인지가 중요하다고 거듭 강조하고 있다. 덕분에 ‘분석’에 매몰되어 있던 시선을 주변으로 환기 시킬 수 있는 계기가 되었다. 특히 ‘문제’,’원인’,’해결방안’을 혼재해 생각했던 것에서 벗어날 수 있어 유용했다.

 

지금 당장 양질의 데이터를 수집해서 활용하기엔 어려운 환경인 것이 사실이다. 그래서 현업에서 요구하는 데이터 역량을 지금 당장 보여줄 수 없는 것도 맞다. 하지만 눈의 틔인 지금부터 조금씩 연습한다면 분명 미래의 나는 지금의 나보다 훨씬 훌륭한 데이터 문해력을 가지고 있을 것이다.

 

툴을 다루는 기술보다 어떻게 “사고해야”하는지가 분석에 더욱 중요하다는 점을 깨닫게 해준 고마운 책이다. 툴 공부도 해야겠지만, 어떻게 삶 속에서 데이터 문해력을 높일 수 있을지 고민해 봐야겠다.