감사의글
서론
1부 사라진 값들의 유령
1 자동으로 생성되는 지식
2 컴퓨터는 논리적 연산을 할 수 있을까?
3 대상화 알고리즘
2부 빈도주의 지식의 가능성
4 죽은 물고기는 신을 믿는가?
5 귀납법과 행동, 빈도주의의 분열된 이론
3부 베이지안 통계의 꿈
6 베이지안 통계와 빈도주의의 문제점
7 베이지안 형이상학과 지식의 기초
8 자동화된 추상화와 소외
결론 혁명을 위한 수학으로
“우리 세계를 작동시키는 숨겨진 코드에 대항할 수 있는 도구를 제공하는 도전적인 작품”
_알렉스 윌리엄스, 이스트 앵글리아 대학교
오늘날 우리는 인공지능, 자율주행, 데이터 사이언스, 기계학습, 그리고 디지털 인문학에 이르기까지 수많은 ‘혁신’ 속에 살고 있다. 그리고 많은 사람들에게 그 모든 것들은 이전에는 존재하지 않았고, 방대한 데이터 세트를 기반으로 새로운 ‘객관성’을 제공해줄 수 있는 도구로 여긴다. 그 믿음은 너무나 확고해서 흔들릴 여지도, 파고들 수 있는 빈틈도 허락하지 않고 있다.
그렇지만 이러한 기술, 그리고 그것을 뒷받침하는 방대한 데이터를 기반으로 한 판단이 ‘가치중립적’인가에 대해서는 의심의 여지가 남는다. 두 가지 사례를 살펴볼 수 있다. 최근 이상적인 사례로 언급되는 테슬라의 자율주행 시스템은 카메라를 활용한 도로 상황인식에서 모터사이클이나 자전거 같은 탈것을 무시하고 충돌하는 사례가 보고된다. ‘역사상 최초로 데이터에 기반한 용의자 정보’를 제공한다고 소개했던, 캐나다의 에드먼튼 경찰서의 사례는 범죄자가 ‘확률적으로 20대 중반의 흑인 남성일 가능성이 높다’는 분석을 내놓으면서, 인종차별 논란에 휩싸였다.
이런 사례들은 통계적 판단이 ‘빅 데이터’라는 알리바이 하에 저지르는 오류를 보여준다. 전자의 경우, 어두운 상황에서 이들 교통수단에서 새어나오는 작은 불빛을 멀리서 주행하는 자동차로 인식하고 정확한 거리를 추론하는데 실패한다. 도로 위를 이동하는 존재들이 다양할 것이라는 가능성을 염두에 두지 않고, 이를 보완할만한 데이터를 수집하지 않기 때문이다. 후자는 광범위한 특정 인종집단이 으레 범죄를 저지를 가능성이 높다는 인종주의적 편견을 낙인처럼 사용하는 사례다.
『혁명을 위한 수학』은 통계, 확률에 기반한 추론과정이 가지는 문제를 역사적으로 탐색하기 시작한다. 이 책을 쓴 기술, 미디어학자 저스틴 조크는 확률의 역사를 탐색하며 명백한 객관성의 영역이라고 여겨지는 수학적 지식이 우리 사회의 질서, 고정관념, 차별