PART Ⅰ 데이터탐색
CHAPTER 01 서론
1.1 데이터사이언스
1.2 데이터분석 목적 및 기법
1.3 래피드마이너
1.4 래피드마이너 스튜디오
1.5 래피드마이너 스튜디오 설치
연습문제
CHAPTER 02 데이터
2.1 변수
2.2 통계량
2.3 래피드마이너 실습
연습문제
CHAPTER 03 데이터정제
3.1 오류정보
3.2 결측치 및 이상치
3.3 변수생성
3.4 자료저장
3.5 Data Editor 창
연습문제
CHAPTER 04 데이터시각화 I
4.1 도수분포표
4.2 상자그림
4.3 막대그래프
4.4 히스토그램
4.5 원그래프
연습문제
CHAPTER 05 데이터시각화 II
5.1 도수분포표
5.2 요약통계량
5.3 히스토그램과 산점도
5.4 상관분석
연습문제
PART Ⅱ 분석기법
CHAPTER 06 선형회귀분석
6.1 선형회귀모형
6.2 선형회귀모형의 종류
6.3 회귀계수 추정
6.4 모형평가
6.5 변수선택
6.6 래피드마이너 실습
연습문제
CHAPTER 07 의사결정나무
7.1 의사결정나무의 개념
7.2 의사결정나무의 구성
7.3 의사결정나무의 형성
7.4 의사결정나무의 예측
7.5 래피드마이너 실습
연습문제
CHAPTER 08 신경망분석
8.1 신경망
8.2 신경망 활용사례
8.3 신경망 작동원리
8.4 래피드마이너 실습
연습문제
CHAPTER 09 군집분석
9.1 군집분석
9.2 군집분석 활용사례
9.3 군집분석 방법
9.4 k-means 방법
9.5 래피드마이너 실습
연습문제
오퍼레이터 정리
이 책의 구성
전체 9장으로 되어 있고, 데이터 분석을 위한 기본 개념과 데이터에 대한 탐색(PART Ⅰ: 1~5장과 데이터사이언스의 대표적인 분석방법(PART Ⅱ: 6~9장의 두 부분으로 구성되어 있다. 학생들이 이해할 수 있는 기초적인 수준의 내용으로 구성하기 위해서, 저자들이 많은 시간 동안 토론과 고민을 통해 각 장의 주제를 선별하여 구성하였다. 각 장에서는 주제에 따른 기초적인 설명과 함께 래피드마이너 스튜디오에서 주어진 데이터를 이용하여 학습한 내용을 실습하도록 되어있다. 분석 순서에 맞추어 실습 화면들이 캡처되어 있어서 컴퓨팅에 익숙하지 않은 학생들도 수월하게 내용을 학습하고 실습할 수 있으리라 생각한다.
데이터사이언스에 대한 기초적 수준의 강의로 활용하는 경우, 한 학기 강의용으로 사용하면 적당할 것으로 생각한다. 다양한 부분에서의 활용도를 생각하면 분석방법에서의 주제를 더 늘여야 할 필요도 있겠지만, 한 학기 교양 강의를 위한 교재를 목표로 시작된 책이니만큼 데이터사이언스에 대한 첫걸음을 도와주는 단계로 이 책이 활용되기를 바란다. 교재에 사용된 자료는 생능출판사 홈페이지에서 내려받을 수 있다.