서문
1장 데이터 분석
1-1 데이터 분석의 여정
1-2 데이터 이해하기
1-3 데이터 분석 개념
2장 데이터 이해와 활용
2-1 빅데이터 이해
2-2 다양한 공공데이터
2-3 CSV 파일 활용
2-4 공공 데이터 활용
3장 데이터 수집 방법
3-1 웹 크롤링 자료 수집
3-2 텍스트 자료 수집
3-3 설문 데이터 수집
3-4 실전 데이터 수집 도전
4장 엑셀 파일 다루기
4-1 엑셀 데이터 읽기
4-2 엑셀 데이터 처리
4-3 엑셀 데이터 활용 도전
5장 탐색적 데이터 분석
5-1 데이터 분석 목적 이해하기
5-2 데이터 처리 과정
5-3 결측치와 이상치
5-4 EDA 도전
6장 데이터 분석 방법론
6-1 데이터 분석 방법론이란?
6-2 회귀 분석 방법
6-3 분류 분석 방법
6-4 군집 분석 방법
6-5 데이터 분석 도전
7장 데이터 분석을 위한 Numpy
7-1 Numpy 이해하기
7-2 배열 프로세싱
7-3 Numpy 데이터 분석 도전
8장 Pandas 활용 데이터 분석
8-1 Pandas 이해하기
8-2 데이터 프레임 프로세싱
8-3 Pandas 데이터 분석 도전
9장 데이터 시각화를 위한 matplotlib
9-1 시각화 이해하기
9-2 pandas 활용 시각화
9-3 Matplotlib 활용 시각화
9-4 데이터 분석 시각화 도전
10장 확률 분석
10-1 확률 분석 이해하기
10-2 확률 변수
10-3 Scipy를 이용한 확률 분석
10-4 확률 분석 도전
11장 통계 분석
11-1 통계 분석 이해하기
11-2 기술 통계
11-3 통계 분석 도전
12장 텍스트 데이터 빈도 분석
12-1 텍스트 데이터 이해하기
12-2 자연어 처리(NLP
12-3 텍스트 데이터 빈도 분석 도전
13장 감성 분석
13-1 감성 분석 이해하기
13-2 감성 분석 적용 분야
13-3 감성 분석 도전
14장 실전 데
- 이 책의 특징
● 각 단원별로 실습 코드에 대한 설명을 포함하여 이론적 이해에서 더 나아가 파이선(python을 활용하여 스스로 데이터 분석을 할 수 있도록 하였다. 파이선 코드에 대한 경험이 부족한 경우에도 예시 코드를 통해 스스로 데이터를 분석할 수 있도록 구성하였다.
● 데이터 분석에 대한 이론적 이해와 더불어 활용적 적용에 초점을 두었다.
● 자신이 가지고 있는 데이터를 원하는 목적에 맞게 분석하여 원하는 문제 해결을 이룰 수 있을 것이다.
● 나아가 데이터 분석을 통해 통찰력을 구비하여 모두가 인정하는 문제 해결 능력자로 성장할 수 있을 것이다.
- 데이터 분석과 파이선(Python
인공지능에 관심이 집중되기 시작하면서 데이터 분석이 두각을 나타나게 되었다. 인공지능의 핵심 부분에 해당하는 기계학습(Machine Learning은 기계가 스스로 학습하는 것이고, 기계가 스스로 학습하기 위해서는 데이터가 절대적으로 중요한 요소가 된다. 데이터를 올바르게 분석하지 못한다면, 기계학습의 결과는 무용지물이 될 뿐이다. 원하는 결과를 얻기 위한 데이터 분석의 여정은 결코 쉬운 도전은 아닐 수 있다. 그러나 가치 있는 도전이고, 누군가에게는 피할 수 없는 운명적 도전이 될 것이다. 이러한 도전이 조금 더 효율적이고 쉽게 이루어지도록, 이 책은 독자의 입장에서 최대한 친절하게 설명할 것이다.
데이터 분석을 위하여 프로그래밍은 필수이다. 이 책에서는 파이선(Python을 사용하여 데이터 분석하는 과정을 소개한다. 파이선은 High-Level Programming Language에 해당하는데, 여기서 High-Level의 의미는 사람이 사용하는 언어에 가장 가까운 프로그래밍 언어로 이해하면 된다. 따라서 간단하고 직관적인 문법으로 이루어져 이해하기 쉽다는 장점이 있다.
- 데이터 분석의 목표
데이터 분석의 목표는 파이선을 도구로 하여 데이터가 가지는 의미를 읽어내는 것이다. 의미를 정확하게 이해한다면, 데이터를 학습하여 데이터가