1부. 전통적인 통계적 추론
01장. 알고리듬과 추론
__1.1 회귀 예제
__1.2 가설 검정
__1.3 주석 및 상세 설명
__1.4 연습문제
02장. 빈도주의 추론
__2.1 실제에서의 빈도주의
__2.2 빈도주의 최적성
__2.3 주석 및 상세 설명
__2.4 연습문제
03장. 베이즈 추론
__3.1 두 가지 예제
__3.2 불충분 정보 사전 분포
__3.3 빈도주의 추론의 결함
__3.4 베이즈/빈도주의 비교 리스트
__3.5 주석 및 상세 설명
__3.6 연습문제
04장. 피셔 추론과 최대 우도 추정
__4.1 우도와 최대 우도
__4.2 피셔 정보와 MLE
__4.3 조건부 추론
__4.4 순열과 랜덤화
__4.5 주석 및 상세 설명
__4.6 연습문제
05장. 모수적 모델과 지수 패밀리
__5.1 일변량 패밀리
__5.2 다변량 정규분포
__5.3 다모수 패밀리의 피셔 정보 경계
__5.4 다항분포
__5.5 지수 패밀리
__5.6 주석 및 상세 설명
__5.7 연습문제
2부. 초기 컴퓨터 시대 기법
06장. 경험적 베이즈
__6.1 로빈의 공식
__6.2 누락된 종 문제
__6.3 의학 예제
__6.4 간접 증거 1
__6.5 주석 및 상세 설명
__6.6 연습문제
07장. 제임스-스타인 추정과 리지 회귀
__7.1 제임스-스타인 추정기
__7.2 야구 선수들
__7.3 리지 회귀
__7.4 간접 증거 2
__7.5 주석 및 상세 설명
__7.6 연습문제
08장. 일반화된 선형 모델과 회귀 트리
__8.1 로지스틱 회귀
__8.2 일반화 선형 모델
__8.3 포아송 회귀
__8.4 회귀 트리
__8.5 주석 및 상세 설명
__8.6 연습문제
09장. 생존 분석과 EM 알고리듬
__9.1 생명표와 위험률
__9.2 검열된 데이터와 카플란-마이어 추정
__9.3 로그 순위 검정
__9.4 비례적 위험 모델
이 책에서 다루는 내용
21세기는 그 영역과 영향 모두에서 통계적 기법이 숨막힐 정도로 확장돼 왔다. 통계적 기법이 현대 과학과 상거래의 방대한 데이터 집합을 다루게 되면서, 이제 ‘빅데이터’, ‘데이터 과학’, ‘머신러닝’이라는 말은 신문 지상에서 흔히 접하는 용어가 됐다. 어떻게 여기까지 오게 됐을까? 그리고 어디로 향하고 있는 것일까? 이 모든 것은 어떻게 통합될 것인가?
이 책은 현대 통계 사상의 집약 과정을 보여준다. 전통적 추론 이론인 베이즈, 빈도주의, 피셔에서 출발해 각 장은 일련의 영향력 있는 주제를 다룬다. 생존 분석, 로지스틱 회귀, 경험적 베이즈, 잭나이프와 부트스트랩, 랜덤 포레스트, 신경망, 마르코프 체인 몬테 카를로, 모델 선정 후 추론 등 수십 가지 주제가 있으며, 현대적 기법을 통해 방법론과 알고리듬을 통계적 추론과 통합한다. 각 장은 수업에서 검증된 연습문제로 끝나며 데이터 과학의 미래 방향을 예측하는 것으로 결론을 내린다.
이 책의 구성
이 책은 크게 세 가지 부분으로 나눠서 관련 역사에 따라 전개된다. 1부에서 이야기할 전통적 추론의 위대한 주제인 베이즈, 빈도주의, 피셔주의는 전자식 컴퓨터 시대가 도래하기 전까지는 제 역할을 했으며, 현대에 와서는 그 기본 윤곽을 변형시키지 않고도 방대한 확장을 하고 있다(전통적 방식과 현대적 방식의 유사점을 살펴볼 수도 있다. 2부에서는 컴퓨터 시대 개발의 초기인 1950년부터 1990년대까지를 알아본다. 이 시기는 전환기로, 이전보다 빨라진 연산이 통계적 기법의 발전에 실제로 기여했는지 없는지를 이론과 실제에서 가장 쉽게 파악해볼 수 있다. 3부에서는 ‘21세기 주제’라는 제목으로 현시대를 다룬다. 현시대는 놀라울 만큼 대단한 알고리듬의 시대다(‘머신러닝’은 다소 불안감을 조성하는 선전 문구다. 이를 정당화하는 것은 현대의 통계적 추론에서 지속적으로 수행되는 과제이기도 하다.
학생판에는 130개의 연습문제를 추가했다. 연습문제는 문제 해결 및 책에 제시된 아이