1장. 데이터 분석 준비
1.1 데이터 분석의 세계
1.2 아나콘다 설치 및 주피터 노트북 실행
1.3 파이썬 핵심 정리
1.4 파이썬 데이터 분석 주요 라이브러리
1.5 데이터셋
2장. 데이터 분석 기본
2.1 넘파이 기본
2.2 판다스 기본
2.3 데이터 로드와 저장
2.4 데이터 확인
2.5 데이터프레임의 컬럼을 다루는 테크닉
2.6 데이터 인덱싱(데이터프레임의 값 선택
3장. 데이터 정제와 응용
3.1 데이터 필터링과 정렬 테크닉
3.2 결측값 처리
3.3 이상값 처리
3.4 문자열 데이터 처리
3.5 카테고리 데이터 처리
3.6 람다를 활용한 데이터 처리 응용 예제
4장. 데이터 병합과 재형성
4.1 데이터 병합
4.2 데이터 재형성과 피벗
4.3 데이터 병합 후 처리
5장. 데이터 집계와 그룹 연산
5.1 그룹 연산의 이해
5.2 피벗 테이블과 크로스탭 활용
6장. 날짜시간 데이터 처리
6.1 날짜시간 데이터 타입
6.2 날짜시간 데이터 인덱스
6.3 Time/Date 컴포넌트
7장. 데이터 시각화
7.1 맷플롯립 데이터 시각화
7.2 시본 데이터 시각화
8장. 데이터 분석: EDA 실습
8.1 데이터 첫 탐색
8.2 데이터 전처리
8.3 데이터 시각화 기초
8.4 데이터 시각화 고급
8.5 실습을 마치며
개발 환경 준비 + 판다스 핵심 기능 + 데이터 시각화 + EDA 실습
판다스는 파이썬 환경에서 데이터를 분석하기에 최적화 된 오픈소스 라이브러리이다. 이 책은 파이썬 데이터 분석을 위한 준비 과정과 알아야 하는 개념 그리고 판다스 핵심 기능과 데이터 시각화 기초까지 다룬다. 또한 파이썬 데이터 분석에 필요한 핵심 레시피를 익힌 뒤 넷플릭스 데이터셋으로 실무도 경험해본다. 현업에 적용할 수 있는 EDA를 실습하고 데이터 간 유의미한 상관관계를 분석하며 데이터 분석 역량을 기를 수 있도록 도와준다.
★ 이 책의 구성
STEP1 데이터 분석 준비 & 기본
개발 환경 구축하기
파이썬 기본 내용
파이썬 핵심 라이브러리 소개 및 기능 설명
STEP2 데이터 정제와 응용
데이터 필터링/정렬 테크닉
결측값/이상값 확인 및 처리
STEP3 데이터 병합/그룹 연산
데이터 병합
테이블 형식 데이터 재배치/피벗
groupby를 활용한 그룹별 요약 및 집계
피벗 테이블과 크로스탭 활용
STEP4 시계열 데이터 처리
날짜시간 데이터 타입
날짜시간 데이터 인덱스
STEP5 데이터 시각화
맷플롯립 기본 핵심
많이 활용되는 시본의 주요 그래프
STEP6 실전 연습
EDA 실습: 넷플릭스 데이터셋
데이터 전처리 기법 적용 및 데이터 시각화 작업
1장_데이터 분석 준비
데이터 분석이 무엇이고 어떻게 진행되며 어떤 역량이 필요한지 살펴본다. 그리고 파이썬 데이터 분석을 실행하기 위한 개발 환경을 구축한 뒤 이 책을 읽는 데 필요한 파이썬 기본 내용과 핵심 라이브러리에 대해 알아본다.
2장_데이터 분석 기본
파이썬에서 데이터 분석을 하기 위해 가장 필수적으로 알아야 할 라이브러리인 넘파이
와 판다스의 기본 사용법을 학습한다. 데이터를 불러오고, 생성하고, 선택하고, 골라내고, 삭제하고 새로운 모양으로 변경하는 등 기초적인 데이터 처리 방법을 배운다.
3장_데이터 정제와 응용
데이터를 처리하고 가공하는 다양한