한국어판 서문
들어가며. 숫자는 거짓말하지 않는다는 거짓말
서론. 차트는 어떻게 우리를 눈멀게 하는가
- 붉게 물든 대선 지도의 비밀
- 1명의 살인마가 범죄율에 미치는 영향
- 정확한 데이터만으로는 부족하다
- 표와 그래프를 해독하는 힘, 도해력
1장. 차트란 무엇인가 : 차트의 요소와 시각적 부호화
- 세계 최초의 차트
- 숫자를 어떻게 시각적으로 보여줄 것인가
- 수직축과 수평축에서 알 수 있는 것들
- 시각적 부호화의 기본 유형
- 평행좌표 그래프와 선 연결 산점도
- 차트를 해석하는 5단계 법칙
2장. 같은 데이터, 다른 그래프 : 척도와 비례
- 팩트와 프로파간다 사이
- 극적인 대비가 낳은 극적인 오류
- 기후변화를 둘러싼 진실 공방
- 기하급수적 증가와 로그 척도
- 한 나라의 빈곤 수준을 좌우하는 색깔 척도
3장. 무엇을 측정하고 어떻게 집계했는가 : 데이터 신뢰도
- 쓰레기가 들어가면 쓰레기가 나온다
- 퍼센트와 퍼센트포인트의 차이
- 최악의 총기 사건을 불러온 차트
- 같은 숫자도 다른 말을 할 수 있다
- 표본은 집단을 얼마나 대표하는가
- 미국에서 포르노를 가장 많이 보는 곳
- 믿을 만한 데이터를 가려내는 법
4장. 편집된 진실에 속지 않으려면 : 데이터 선별과 모집단
- “연쇄 이민을 끝낼 때가 됐다”
- 불법체류자 범죄율의 실체
- 평균값이 말해주지 않는 것들
- 할리우드 역대 최고 박스 오피스를 달성한 영화
- 천연두보다 백신이 더 위험하다고?
- 출산율이 감소하는 진짜 이유
5장. 신뢰도 95%의 비밀 : 미래 예측과 불확실성
- 지구온난화 예측 모델
- 오차는 오류의 동의어가 아니다
- “죽음의 원뿔”에 관한 오해
6장. 상관관계는 인과관계가 아니다 : 데이터 패턴 읽기
- 행복 지수를 좌우하는 것들
- 가난한 사람들은 부자를 위해 투표하는가
- 오바마케어와 경제 회복
- 가짜 인과관계에 유의하라
결론. 좋은 차트는 더
“선거 지도는 어떻게 민심을 왜곡하는가?”
“영점에서 시작한 기후변화 그래프가 잘못된 이유는?”
모든 숫자와 그래프가 의심스러워지기 시작했다!
복잡한 현실을 빠르고 정확하게 간파하는 데이터 독해력 기르기
지난 19대 대선은 우리에게 잊을 수 없는 선거였다. “헌정 사상 최초 대통령 탄핵의 결과”, “2000년대 최고 투표율”, “개표 방송 실시간 시청률 40%”, “장미 대선” 등 여러 수식어가 뒤따랐지만 그중에서도 모두가 기억하는 것은 “문재인의 압승”이었다. 그 중심에는 후보자의 득표율을 기준으로 전국의 시와 도를 파란색 또는 빨간색으로 채운 선거 지도가 있다. 전국의 3분의 2가 파란색으로 물든 이 지도를 더불어민주당과 여러 언론에서는 압도적인 지지의 근거로 제시했다. 그러나 당시 문재인의 득표율은 41%로 과반을 넘지 못했고, 맞수였던 자유한국당 홍준표는 24%, 국민의당 안철수는 21%의 표를 얻었다. 안철수는 득표율이 세 번째로 높았지만 지도에 표시되지도 않았다. 문제의 선거 지도는 ‘누가 이겼는가’를 보여줄 뿐 ‘얼마나 지지받았는가’는 알 수 없다. 일종의 착시 효과가 생겨난 것이다.
선거 결과뿐 아니라 뉴스 기사, 보고서, 경제 전망, 태풍 예보, 코로나19 현황 등 일상의 거의 모든 분야에서 차트가 사용되고 있고 그 중요도가 나날이 높아지고 있다. 그러나 사람들 대부분은 차트를 접했을 때 보이는 그대로 받아들일 뿐 그것을 어떻게 읽고 해석하는지는 모르는 경우가 많다. 그 결과 자기도 모르게 차트의 속임수에 넘어가곤 한다.
데이터 시각화 분야의 세계적 권위자인 알베르토 카이로의 신작 『숫자는 거짓말을 한다』는 일상적으로 접하는 표와 그래프, 지도, 다이어그램 등의 차트가 우리를 어떻게 속이는지 밝힌 책이다. 저자는 모든 데이터는 차트로 어떻게 표현하는가에 따라 왜곡될 수 있다고 말한다. 기후변화에 관한 두 개의 선 그래프가 대표적인 사례다. 1880~2012년 지구 평균기온은 1.4℉ 상승했다. 같은 데이터를 사용했지만 하