Search
✉️

데이터는 그 자체로 반드시 사실을 의미한다?

생성일
2021/08/25 07:21
태그
속성
데이터는 그 자체로 반드시 사실을 의미할까요?
데이터에서 의미를 찾아내기 이전에 그 지표에 한계가 있는 것은 아닌지, 자신이 그 개념을 정확히 이해하고 있는지를 먼저 생각해보아야 합니다. 숫자로 된 데이터가 제시되었다해서 무조건 신뢰할 만한 자료라고 생각하지 않아야 하며, 데이터를 비판적으로 바라볼 줄 알아야 합니다. 비판적인 관점으로 지표를 정확히 이해할 때 데이터에서 유의미한 인사이트를 도출해 낼 수 있습니다.
이렇게 데이터에서 숨겨진 의미를 찾아내고 해석해 가치를 발굴하는 능력을 ‘데이터 리터러시’ (데이터 문해력) 이라고 합니다. 데이터 리터러시는 데이터를 목적에 맞게 활용하는 데이터 해석 능력을 말합니다. 여기서 데이터의 범위는 고도의 처리 기술을 요하는 빅데이터뿐만 아니라, 단순 수치나 통계자료도 포함합니다.
따라서 ‘데이터 리터러시’는 데이터와 관련된 일을 하는 전문 영역의 사람들에게만 필요한 것이 아니라 데이터 활용이 증가하고 있는 시대에, 우리 모두에게 필요한 역량이라고 할 수 있습니다.
데이터 해석 능력이 어렵게 느껴질 수도 있지만, 모두가 데이터를 잘 다뤄야 한다는 말을 의미하는 것이 아닙니다. 핵심은 ‘데이터 해석 능력이 필요하다는 사실’을 인식하는 것입니다.
미국 노스캐롤라니아 대학 졸업생 중 평균 연봉(초봉)이 가장 높은학과는 어디일까요?
답은 지리학과로, 평균 연봉(초봉) 연 1억원을 기록했습니다.
어째서 지리학과 학생들이 이렇게 높은 연봉을 받을 수 있었을까요?
지리학과 졸업생 중 전설적인 농구선수 마이클 조던이 포함되어 있었기 때문입니다!
이는 데이터통계 오류의 대표적인 예 입니다. 이렇듯, 수치로 표현된 데이터가 반드시 현상을 나타내는 것은 아니라는 사실을 알 수 있습니다.
‘AI판사'라는 말을 들어보셨나요?
미국 법원에서 사용하는 알고리즘 중 ‘콤파스(COMPAS)’라는 것이 있습니다.
이 알고리즘은 피고인의 여러 데이터를 점수로 환산해 재범 가능성을 계산한 뒤 판사에게 구속 여부를 추천해준다고 합니다. 그런데 콤파스가 얼굴인식과 재범 가능성 예측에서 유색인을 차별하는 사례가 알려지며 논란이 일고 있습니다.
콤파스는 흑인의 재범 가능성을 실제보다 높게 판단하고 백인은 실제보다 낮게 산출했습니다. 알고리즘이 범행 뒤 검거되는 비율을 바탕으로 판결을 결정했기 때문입니다.
실제로, 미국에서 범행 뒤 체포되는 흑인 비율이 백인보다 2배 이상 높다고 합니다. 데이터 기반 의사 결정 과정에서 사회적 배경과 문제를 생각하지 않을 경우 이와 같은 큰 부작용을 초래할 수 있습니다.
시각화 자료를 볼 때도 리터러시 역량이 필요합니다.
데이터 시각화는 방대한 양의 데이터를 한눈에 보고 데이터의 의미를 파악하는데 효과적인 방법입니다. 많은 사람들이 데이터 분석 결과나 통계 결과를 다른 사람들에게 효과적으로 전달하기 위해 시각화 자료를 제작합니다. 이때 작성자는 자신의 의도에 따라 시각화 유형을 선택하고 활용합니다.
                           
JTBC 뉴스룸은 김영란법 국회 통과와 대선 후보 지지도의 데이터를 시각화하는 과정에서 오류를 범했습니다. 오른쪽 옳은 그래프와 비교하면 도넛차트와 막대그래프 모두 과장되어 표현 된 것을 확인할 수 있습니다
MBN의 시사프로 '판도라'에서는 공수처 설립 찬반 그래프를 수치와 달리 왜곡하여 보도했습니다. 우측 그래프와 비교해 보았을 때, '반대(12.6%)'의 비율이 과장된 것을 확인할 수 있습니다.
데이터를 시각화하는 것은 분명 시각적으로 데이터의 의미를 명확히 전달한다는 장점을 가지고 있지만, 어떤 형태로 시각화하느냐에 따라서 정보 전달 효과에는 차이가 있을 수 있습니다.
위 사례처럼 데이터의 의미가 왜곡되어 전달될 경우 오해의 소지를 만들 수 있고, 특히 데이터가 의사결정의 수단으로 활용되었다면 잘못된 의사결정에 따른 피해를 보게 됩니다. 따라서 우리는 시각화 자료를 바탕으로 데이터를 읽을 때에도 비판적으로 바라볼 줄 알아야 합니다.
빅데이터 시대에 데이터 활용 가능성이 커지면서 ‘데이터 리터러시’는 누구에게나 필요한 역량으로 자리 잡아가고 있습니다. 데이터에서 올바르게 의미를 읽어내기 위한 사고방식의 중요성에 대해 생각해보는 기회가 되었으면 좋겠습니다.