서문
Part 1 자료분석의 과학적 기초
chapter 01 사회공학에서 사회과학으로
제1절 사회공학의 탄생
제2절 열광, 희열, 그리고 공황
제3절 맬더스 트랩은 존재하는가
제4절 사회과학 자료분석의 세 가지 장
제5절 21세기 사회과학 자료분석 방법론 58
요약 | 사회공학적 연구로 흐르지 않기 위해 사회과학 자료분석 시에 유의해야 할 점
chapter 02 확률
제1절 확률의 역사
제2절 확률의 전복
제3절 확률이론
제4절 순열
제5절 조합
제6절 확률변수
요약 | 확률
chapter 03 확률분포
제1절 확률분포와 자료 생성 과정
제2절 이산확률분포
제3절 연속확률분포
제4절 중심극한정리
제5절 확률분포의 확장
요약 | 확률분포
Part 2 자료에서 분석으로
chapter 04 독립성, 연관성, 그리고 상관성
제1절 연관성
제2절 상관성
제3절 생태학적 오류와 심슨의 역설
요약 | 독립성, 연관성, 그리고 상관성
chapter 05 회귀분석
제1절 회귀분석이란 무엇인가
제2절 선형 회귀분석의 수학적 기초: 1차 선형함수
제3절 선형 회귀모형의 기본 구조
제4절 선형 회귀모형의 해석
제5절 R을 이용한 골튼의 신장유전 회귀분석
요약 | 회귀분석
Part 3 통계적 추론
chapter 06 선형 회귀분석 모형과 최소 제곱 추정법
제1절 최소 제곱 추정법이란 무엇인가
제2절 단순 선형 회귀모형
제3절 다중 선형 회귀모형
제4절 회귀분석 모형의 진단
제5절 caret 패키지를 이용한 선형 회귀분석 모형의 교차타당성 검증
제6절 선형 회귀분석은 다른 최적화 방법에 비해 열등한 분석 방법인가
제7절 종속변수와 설명변수가 뒤바뀌면 결과가 달라지는가
요약 | 최소 제곱 추정법
chapter 07 일반 선형 모형과 최대 우도 추정법
제1절 최대 우도 추정법을 이용한 통계적 추론
제2절 일반 선형 모형
제3절 최대 우도 추정법을 이용한 일반 선형
스프레드 시트와 드랍다운 메뉴에 의존하는 자료분석은 치명적인 오류를 낳을 가능성이 매우 높다. R은 21세기의 새로운 자료분석 환경에 걸맞는 통합적 자료분석 플랫폼을 제공해 주는 뛰어난 통계 소프트웨어이다. 이 책은 사회과학자들이 R을 이용하여 21세기의 변화된 자료분석 환경에 걸맞는 새로운 자료분석 루틴을 체득하는 것을 돕기 위한 책이다.
이 책에서 말하는 21세기의 변화된 자료분석 환경이란 (1 자료형태의 확대, 자료의 양적 증가, 자료처리 기술의 발전, (2 모형의 복잡성과 다양성 증가, (3 추정 방법의 다양화, 그리고 (4 컴퓨터 연산 능력의 비약적 성장으로 요약할 수 있다. 저자는 지난 10여 년 동안 “사회과학자를 위한 데이터 과학이란 무엇인가?”를 고민해 왔으며 그 과정에서 느끼고 깨닫고 배운 바를 이 책에 정리하였다.
20세기 경험적 사회과학은 실험방법과 확률이론, 그리고 통계학을 수용하여 놀라운 성취를 이루었다. 21세기 경험적 사회과학이 자료분석 환경의 급격한 변화라는 도전을 과학성(scientificity 향상의 기회로 만들 수 있을지는 전적으로 사회과학 경험연구자들의 손에 달려 있다고 볼 수 있다. 이 책은 그 도전의 길에 서 있는 사회과학자들에게 작은 안내서가 되고자 한다.
대학 수업 환경(수업시수에 맞게 12장으로 구성했으며, 자료분석 도구로 R을 사용했다. 책에 등장하는 다양한 자료분석의 과정을 하나씩 따라가면서 분석모형을 구현해볼 수 있게 구성되어 있다. 정치외교학, 사회복지학, 사회학, 행정학, 심리학, 교육학 등 여러 사회과학 분야의 연구방법론 수업에 교재로 활용할 수 있다.
책의 구성과 내용
『사회과학자를 위한 데이터 과학: R을 이용한 사회과학 자료분석』이 데이터 과학에 대한 일반적인 책들과 다른 점은 사회과학 자료분석의 본질적 특징과 데이터 과학의 최신 연구방법이 어떻게 조화될 수 있을 것인가에 초점을 두고 있다는 점이다. 이를 위해서 이 책은 필요할 때마다 시간을 거슬러 올라가 19세기와 20세기 동안