Chapter 01 데이터 과학 알아보기
01 데이터 홍수 시대
02 데이터 과학 열풍
03 데이터 과학이란?
04 데이터 과학의 절차
4.1 세상과 상호작용하는 데이터 과학
4.2 이 책에서 다루는 범위와 내용
05 데이터 과학 관련 분야
06 데이터 과학 자원
6.1 데이터 저장소
6.2 온라인 교육 사이트
6.3 소프트웨어 도구
6.4 R 공식 문서
역사 속의 데이터 과학
단원문제
Chapter 02 데이터 과학으로 풍덩
01 도구 챙기기
02 데이터와 친해지기
03 데이터 시각화 맛보기
04 데이터 과학 학습을 위한 좋은 습관 알아보기
4.1 도움말 청하기
4.2 익숙해지기
4.3 점증적으로 생각하기
4.4 좋은 도구 쓰기
05 좋은 도구 익히기
5.1 통합 개발 환경
5.2 스크립트 창에서의 코딩
5.3 작업 디렉토리의 지정
5.4 라이브러리의 활용
06 데이터와 더 친해지기
6.1 사랑스런 iris 데이터
6.2 돈을 벌어주는 tips 데이터
나는 아마추어 데이터 과학자?
단원문제
Chapter 03 R의 데이터형과 연산
01 데이터의 저장과 처리
02 변수
03 데이터형
04 연산자
05 벡터
5.1 벡터 생성
5.2 벡터 연산
5.3 벡터 연산에 유용한 함수
06 배열(행렬
6.1 배열 생성
6.2 배열 연산
6.3 배열에 유용한 함수
07 데이터 프레임
7.1 데이터 프레임 생성
7.2 데이터 프레임 요소에 접근
7.3 데이터 프레임에 유용한 함수
08 리스트
8.1 리스트 생성
8.2 리스트 요소에 접근
8.3 리스트에 유용한 함수
유용한 R 스튜디오 사용법
단원문제
Chapter 04 데이터 취득과 정제
01 파일 읽고 쓰기
1.1 파일 읽기
1.2 파일 쓰기
02 데이터 정제를 위한 조건문과 반복문
2.1 조건문
2.2 반복문
03 사용자 정의 함수 : 원하는 기능 묶기
04 데이터 정제 예제 1 : 결측값 처리
1. 데이터 과학의 시작(1~2장 : 데이터 과학의 개념을 정립하고, 베이스 R과 R 스튜디오로 간단한 데이터를 실제로 다뤄봄으로써 데이터 과학의 세계로 들어갑니다.
2. R의 데이터형과 연산(3장 : 변수, 데이터형, 연산자, 벡터, 데이터 프레임, 리스트를 배우며 R의 기본기를 다집니다.
3. 데이터의 취득·정제·가공(4~5장 : 데이터 취득을 위한 파일 읽기와 쓰기, 데이터 정제를 위한 제어문과 결측값·이상값 처리, 데이터 가공을 위한 dplyr 라이브러리 사용법 등을 익힙니다.
4. 데이터 시각화(6장 : 베이스 R과 ggplot2 라이브러리의 시각화 함수를 이용해 데이터를 이리저리 살피며 전체 데이터를 한눈에 직관적으로 알아볼 수 있게 만드는 방법을 익힙니다.
5. 모델링과 예측(7~10장 : 7~ 9장에서는 데이터를 가장 잘 설명할 수 있는 모델을 만들고 이 모델로 예측하는 방법을 학습합니다. 10장에서는 모델의 성능을 평가하는 방법과 가장 좋은 모델을 선택하기 위한 기준을 알아봅니다.
6. 텍스트 마이닝(11장 : 텍스트 데이터를 처리하는 방법을 익히기 위해 문서 단어 행렬을 구축하고 한국어와 영어에 대한 단어 구름을 그려봅니다.
7. 프로젝트(12장 : 지금까지 학습한 전 과정을 구글 플레이 스토어 앱 데이터에 단계별로 적용해봅니다.