지금과 같은 IT기술이 없던 시절, 열악한 환경 속에서 위대한 업적을 남긴 인물들이 있습니다.
김정호의 대동여지도
잘 알고계시겠지만, 1861년 철종 12년에 제작된 ‘대동여지도’는 물줄기와 산줄기, 고을과 도로 등 자연과 인문지리 정보를 모두 담고 있으면서 놀라울 정도로 정확한 실측지도입니다.
대동여지도에서 임의의 두 지역을 연결해 이동 가능한 길의 거리를 구한 후 21만배 정도 곱하면 현재의 실제 거리와 거의 일치한다고 합니다.
여러 문헌에서 김정호가 대동여지도를 완성하기 위해 한반도를 여러차례 답사하고 산에 올랐을 것이라는 주장이 많았습니다.
하지만 정상기 <농포문답>에 의하면 한두차례 당시 한반도를 최소한으로 둘러보았고 대신에 읽고 보고 들은 간접경험들을 잘 정리했을 가능성이 높다고 합니다.
또 다른 문헌에서는 “나의 벗 김정호는 등관일때부터 지도와 지리지에 깊은 뜻을 두고 오랫동안 찾아 자세히 살폈고… 한가한 때에 수집한 것을 세세하게 살폈다" 라고 적혀있습니다.
답사만 한 것이 아니라 다양한 수집 자료를 분석한 것은 사실인 듯 합니다.
나아가 분석결과를 전체 한반도 축척지도로 옮기는 과정에서는 방안좌표를 이용해 지도의 공간을 동일하게 비율화해 지도가 정확하게 실제거리를 반영하도록 했습니다.
그리고 하천과 도로 산악 등의 표시에서 기호, 축척, 점, 선의 표시에서 서로 분별이 용이한 표준화 작업도 포함시켜 이 지도를 더 위대하게 만들었습니다.
대동여지도는 김정호의 매우 정교한 데이터 분석, 시각화의 결과물이 아닐까요?
나이팅게일의 로즈다이어그램
1854년 영국 상류층 출신의 나이팅게일이 군 간호사로서 크림 전쟁에 참전했고, 그녀의 노력으로 40%를 넘던 영국군 야전병동의 사망율이 2%로 낮아졌다.
여기까지가 일반적으로 나이팅게일에 대해 알려진 사실입니다. 하지만 실질적으로 수많은 생명을 살린 것은 나이팅게일의 희생만이 아닌 바로 통계였습니다.
나이팅게일은 병원의 모든 상황을 기록하도록 기준을 세우고 모든 내역을 상세히 기록했습니다. 이를 바탕으로 작성된 보고서는 군인들의 사망 원인이 전쟁의 부상보다는 비위생적인 환경에 의한 2차 감염과 부족한 의료용품 때문이라는 것을 구체적으로 보여주었습니다.
전쟁이 끝난 후에는 영국 전체의 의료위생환경을 개선하기 위해 노력했지만 설득은 쉽지 않았습니다. 나이팅게일은 사람들이 숫자로 채워진 복잡한 통계자료를 제대로 이해하지 못한다는 것을 깨닫고 통계 결과를 이해하기 쉽도록 도표를 활용했습니다.
이 노력의 결정체가 바로 나이팅게일의 로즈 다이어그램입니다.
오른쪽은 1854년 4월부터 1855년 3월까지의 통계이고, 왼쪽은 이후 1년간의 통계입니다.
각각의 원은 크기가 다른 12개의 조각으로 되어 있고 각 조각은 월을 가르킵니다.
조각의 면적은 그 달의 사망자 수를 의미하는데 각각의 색깔은 서로 다른 사망원인을 표현한 것입니다. 회색은 질병으로 죽은 사망자 수이고, 빨간색은 전쟁 부상으로 죽은 사망자 수이고, 검은색은 기타 여러 이유로 죽은 사망자 수를 뜻합니다.
오른쪽 도표에는 회색 부분, 즉 질병에 의한 사망자 수가 절대적으로 많음을 보여주고 있고, 왼쪽 도표에서는 회색 부분이 대폭 줄었음을 알 수 있습니다.
이 도표는 통계를 배우지 않은 일반인들도 이해할 수 있을 만큼 쉬웠기 때문에 문제를 감추려고만 했던 정부와 군부도 영국의 의료체계 개혁에 나설 수 밖에 없도록 만들었다고 합니다.
1) 의료기록을 표준화했다.
2) 모든 의료상황을 빠짐없이 기록했다.
3) 기록을 통계로 정리했다.
4) 데이터를 이해하기 쉽게 도식화했다.
5) 사람들에게 널리 알렸다.
데이터를 수집하고 정제해 도식화하는 과정이 꼭 지금의 빅데이터 분석 프로세스와 일치하네요?
디지털 시대, 프로그래밍과 AI, 빅데이터를 기반으로 하는 최근과는 분명히 다르지만 아날로그시대의 데이터 사이언티스트라고 지칭할 수 있을 것 같습니다.