데이터 문해력

데이터 리터러시_주장&비판 역량

기획자 에이든 2024. 3. 23. 11:46

데이터씽킹, 티키타카! 4차시 - [ 데이터 주장 비판역량 ]

 

[ 데이터 주장 비판 역량 ] 

역량 정의 : 모든 기획 역량의 기저를 형성하는 역량으로서, 데이터를 분석하여 상관 관계를 파악하는 역량

역량 목표 : 메시지와 근거 데이터를 보고 사실성, 연관성, 충분성의 관점에서 엄밀한 비판을 할 수 있다.

 

데이터를 잘 비판할 수 있어야 감각 있게 다룰 수 있다.

따라서 분석 기획 역량에 앞서 비판 역량을 단단히 하는 것이 중요하다.

 

이번 차시 문제는 아래 그래프를 보고
학업 능력과 폭력성 사이 상관관계가
있는지 없는지를 판단하는 것이다.

X축 : (2012년 A학교 수능 응시생 중 1~2등급 학생 수) / (2012년 A학교 수능 응시생)
Y축 : A학교 조사 응답 학생 중 '학교에 일진이 있어요'라고 답한 학생의 비중


주어진 그래프를 보면 딱히 정적/부적
관계에 놓여 있지 않은 것 같기도 하다.
하지만 잘 살펴보자면 이렇게 볼 수 있지 않나?

이런 관점에서 X축과 Y축은 약하지만
상관관계를 가지고 있다고 볼 수 있다.

 

하지만 그게 학업 능력과 폭력성의 상관관계
의미하느냐고 묻는다면 아니라고 생각한다.

 

X축의 점들은 학생 개개인의 학업 성취를 나타내는 것이
아니라 학교 내에 1~2 등급 학생의 비율이기 때문이다.

 

즉 X축의 의미가 '개인의 학업 능력'이라 하기엔 어폐가
있으므로 학업 능력과 폭력성의 상관관계는 알 수 없다.

 

X축의 오른쪽으로 갈수록 학업 성적이 뛰어난 사람이
많은 것은 사실이며 이는 개인의 학업 능력이라기보다


학업에 집중하기 좋은 분위기를 가진 학교라고
보는 게 조금 더 합리적이지 않을까 생각한다.

과연 해설은 어떤 결론을 내렸을지 보자 :D


질문에 답변한 많은 학습자들이 데이터의
전체가 아닌 일부를 해석하고 있었는데
데이터는 전체를 볼 줄 알아야 한다.

 

[Best 답변]

결론 : 이 정보만으로는 폭력성과 학업 능력의 상관관계를 정확히 알 수 없다.

  1. 수능에 응시하는 학생 수의 비율이 학교마다 상이할 것이므로 1~2 등급 합계 비율만으로는 해당 학교의 수능 미응시자를 포함한 학업 능력을 정확히 알 수 없다.
  2. 일진이 있다는 답변이 폭력성과 정비례하지 않을 수 있다. 소수의 유명한 일진이 있는 학교도 일진이 있다고 응답할 수 있기 때문이다. 따라서 이러한 응답이 해당 학교의 전반적인 폭력성을 대표하기는 어렵다.

 

[강사님 해설]

이 데이터는 3가지 비판 포인트가 필요하다.

  1. X축이 스캐터 차트의 모양으로 관계를 파악할 수 있는 성질이 아니다.
    1. 수능 응시생의 비율은 학교마다 상이할 것이므로 1~2등급 합계 비율만으로는 해당 학교의 수능 미응시자를 포함한 학업 능력을 정확히 알 수 없다(의미를 갖기 어렵다).
    2. 어떤 학교가 공부를 잘하는지는 1~2등급 비율만 보고 알 수 없다.
    3. 이와 같이 변수가 한쪽에 몰려 있는 형태로 밖에 나올 수 없는 데이터를 가지고는 스캐터 차트를 이용해서 관계를 파악할 수 없다. 
  2. Y축은 인식이라는 개념 때문에 질에 의해서 양의 데이터에 노이즈가 발생할 수 있다.
    1. 만약 일진이 1명밖에 없는데 굉장히 유명한 경우 일진 인식률이 높을 수도 있다. 
    2. 상대방의 논리 구조에 의구심을 전달하는 것만으로도 매우 좋은 비판이 될 수 있다. (예 - 만약 이런 경우라면 사각지대가 존재하지 않을까요?)
  3. 아웃라이어를 보고 원천 데이터의 사실성을 의심할 필요가 있다.
    1. 돌발적인 데이터(아웃라이어) 하나보다 y축 전체의 합리성을 의심해 볼 필요가 있다. 
    2. 데이터에 나온 아웃라이어는 민사고의 정보로 해당 학교에서 단 두 명이 응답하여 비율이 매우 높게 나온 케이스였다. 

** 아웃라이어 : 평균치에서 크게 벗어나서 다른 대상들과 확연히 구분되는 표본. 전체 변량에서 너무 많이 떨어져 있어서 분석에서 아예 제외하는 것이 분석의 선명성에 도움을 주기도 함.

 

비판은 상대방에게 무안을 주려는 행동이 아니라 상대방의 주장에서 보강할 영역을 명확히 해줌으로써 더 좋은 분석과 결론으로 나아갈 수 있도록 도움을 주는 것이다.

 

비판 능력 = 데이터 기반의 문화 형성을 위해 조직에 반드시 필요한 문화적 요소

 

[핵심] 데이터가 가지고 있는 특징을 보고 충분히 공감하는 동시에 데이터가 주장을 지지하는데 결함이 있는지 없는지를 파악하는 태도가 필요하겠다!

 

비판 역량을 높이는 세 가지 질문

  1. 그게 사실인가? (사실성)
  2. 그게 그것인가? (연관성)
  3. 그게 전부인가? (충분성)

 

사실성 : 데이터가 오류가 있는 경우 데이터가 지지하고자 했던 주장도 함께 오류가 있는 것으로 받아들여짐.
→ 데이터의 계산 방식과 논리구조 점검하기

연관성 : 데이터의 내용은 사실이나 데이터의 주장과 관련이 없는 경우. 같은 키워드를 공유한다 하더라도 관련 없는 주장일 수 있음

충분성 : 분석의 양이 충분하지 않은 경우

 

데이터 분석은 그 자체로 아릅답기보다 설득의 도구로서 활용되어야 함. 따라서 문제가 없고 관련성이 있다에서 끝나는 것이 아니라 상대방의 마음을 움직이는 분석이냐가 중요.


문제를 보자마자 이건 상관관계가 있다 없다를
판단하는 것이 전부가 아니라는 걸 느꼈다.

 

상관관계를 알 수 없다는 결론은 동일하나,

그 과정이 너무도 달라서 민망할 정도다 ㅎㅎ..

 

앞으로 데이터를 볼 때 반드시 세 질문을 떠올리자.
사실인가? 연관이 있는가? 충분한가?

 

비판 역량을 단단히 한 후에는 기획도
한층 더 견고해지리라고 믿는다! :D