Chapter 1 데이터 구조에 익숙해지기
1.1 데이터 분석 과정 이해하기
1.2 판다스를 사용하는 이유 - 클래스
1.3. 판다스를 사용하는 이유 - 메소드나 함수
Chapter 2 판다스의 기본 클래스 알아보기
2.1 시리즈와 데이터 프레임 구조
2.2 시리즈 생성 방법
2.3 데이터 프레임 생성
2.4 인덱스 검색
2.5 인덱서 검색
2.6 갱신과 삭제 처리
2.7 문자열 데이터 처리
Chapter 3 판다스 시리즈와 데이터 프레임 실행하기
3.1 메소드
3.2 인덱스 레이블과 누락 값 처리
3.3 범주형 데이터 처리
Chapter 4 판다스 Index 클래스 이해하기
4.1 숫자와 문자 인덱스 처리
4.2 날짜 및 범주형 인덱스 처리
4.3 멀티인덱스 처리
Chapter 5 데이터 재구성하기
5.1 정렬 처리
5.2 데이터 구조 변경
Chapter 6 쿼리처럼 데이터 처리하기
6.1 데이터 연결
6.2 조건절 처리하기
6.3 내부의 값을 그룹화 처리
Chapter 7 통계 및 샘플링 처리 알아보기
7.1 기본 통계 메소드
7.2 샘플링 메소드 적용
Chapter 8 문자열과 일반 함수 벡터화 처리하기
8.1 일반 함수를 정의해 적용
8.2 사용자 정의 함수를 인자로 전달해 처리
8.3 문자열 로직 실행
Chapter 9 데이터 시각화 알아보기
9.1 그래프
9.2 판다스 선 그래프 작성
9.3 판다스의 기타 형태 그래프 작성
Chapter 10 데이터 정돈 사례 분석하기
주피터 노트북과 파이썬을 이용한 데이터 분석
파이썬 코드를 읽고 작성이 가능한 개발자라면 데이터의 가공, 변환, 정제를 판다스 라이브러리를 이용해서 잘 다루고 싶을 것이다. 이 책에는 판다스 내의 시리즈와 데이터프레임 클래스의 속성, 메소드의 기능 설명과 예제를 통해 사용법을 이해할 수 있다.
이 책은 정돈된 데이터를 만드는 다양한 사례를 보여주고 주피터 노트북을 이용해서 직접 실습할 수 있는 구성으로 데이터 과학을 배우고자 하는 분들에게 출발점이 되어줄 것이다.
이 책의 특징
- 데이터 정제, 변형 등의 예제를 통해 판다스 모듈 내의 함수와 클래스에 대한 개념을 쉽게 이해할 수 있다.
- 시리즈와 데이터프레임 내의 메소드 작동 원리를 알 수 있다.
- 데이터 정돈과 시각화를 연계한 예제를 제공해 실무로 확장할 수 있다.
이 책이 필요한 독자
- 파이썬 개발이 가능하고 데이터 분석에 관심을 가진 개발자
- R뿐만 아니라 파이썬으로도 데이터 분석 기법을 확대하려는 데이터 분석가
- 기존 엑셀 매크로를 활용한 작업이 가능한 일반인
독자대상
초중급
소스코드 다운로드
https://github.com/bjpublic/handinpandas
데이터를 전처리해서 데이터 분석에 사용하려면 먼저 데이터들을 분석에 필요한 방향으로 정리해야 합니다. 단순히 값만 정리하는 것이 아니라 데이터를 접근할 수 있는 레이블도 명확히 정의해야 합니다. 판다스 모듈은 이런 데이터 분석에 맞는 기능을 지원하는 클래스인 시리즈와 데이터 프레임을 제공하는데, 이를 이용해서 다차원 데이터에 쉽게 접근하고 변경할 수 있습니다.
데이터를 분석하려면 왜 판다스가 필요한지를 이해하고 세부 기능들을 예제를 통해