1부. pandas 시작하기
1장 데이터 분석 소개
__1장 교재
__데이터 분석 기초
____데이터 수집
____데이터 랭글링
____탐색적 데이터 분석
____결론 도출
__통계 기초
____표본 추출
____기술통계학
____추론통계학
__가상 환경 설정하기
____가상 환경
____필수 파이썬 패키지 설치하기
____왜 pandas인가?
____주피터 노트북
__요약
__연습 문제
__참고 자료
2장. pandas DataFrame으로 작업하기
__2장 교재
__pandas 데이터 구조
____시리즈
____인덱스
____DataFrame
__pandas DataFrame 만들기
____파이썬 객체로 DataFrame 만들기
____파일로 DataFrame 만들기
____데이터베이스로 DataFrame 만들기
____API에서 DataFrame 만들기
__DataFrame 객체 확인하기
____데이터 검사하기
____데이터 설명 및 요약하기
__데이터의 부분집합 선택하기
____열 선택하기
____슬라이싱
____인덱싱
____필터링
__데이터 추가하고 제거하기
____새로운 데이터 만들기
____원하지 않는 데이터 삭제하기
__요약
__연습 문제
__참고 자료
__데이터
2부. pandas로 데이터분석하기
3장. pandas로 데이터 랭글링하기
__3장 교재
__데이터 랭글링 이해하기
____데이터 정제
____데이터 변환
____데이터 강화
__기온 데이터를 찾고 수집하고자 API 사용하기
__데이터 정제
____열 이름 바꾸기
____유형 변환
____데이터 재정렬, 재인덱싱, 정렬
__데이터 재구성하기
____DataFrame 전치
____DataFrame 피보팅
____DataFrame 멜팅
__중복, 결측, 유효하지 않은 데이터 다루기
____문제가 있는 데이터 찾기
____문제 완화하기
__요약
__연습 문제
__참고
추천의 글
교육자들은 자신이 선호하는 매체를 사용해 가르치는 경향이 있다. 개인적으로 경력을 시작할 즈음의 나는 비디오 콘텐츠에 매료됐다. 온라인 콘텐츠를 제작하면서 자주 듣는 질문 중 하나는 놀랍게도 ‘데이터 과학을 시작하는 사람들에게 추천할 만한 책이 있나요?’라는 질문이었다.
온라인에 좋은 자료가 많이 있는데도 책을 찾는 것에 처음에는 당황했으나 이 책을 읽은 후에는 데이터 과학 학습을 위한 책에 대한 내 인식이 바뀌었다.
이 책에서 가장 마음에 들었던 것은 책의 구성이었다. 적절한 양의 정보를 제때에 제공해 여러분이 자연스럽게 진도를 나갈 수 있도록 하고 있다. 본서를 통해 통계와 관련 개념에 관한 기초 지식부터 시작해 실습을 바탕으로 이론을 배울 수 있을 것이다.
기초를 배우고 나면 이 책의 핵심인 pandas를 만나게 된다. 저자는 (이전에 여러분들이 사용했던 것과 같은 오래된 데이터가 아닌 최신 실제 데이터를 사용해 모듈(module에 생명을 불어넣는다. 나 역시 이 책을 통해 몇 가지 기술을 배웠다.
이 책의 후반부에서는 pandas의 강력한 기능을 바탕으로 무엇을 할 수 있는지 배운다. 저자는 머신러닝의 고급 개념도 자세히 소개하지만 지나치게 기술적인 전문 용어를 사용하지 않으면서 진도를 나가는 데 필요한 정보를 충분히 제공한다.
나는 저자와 대화하면서 이 책에 대한 그녀의 자부심을 느낄 수 있었다. 이 책은 데이터 과학의 도구를 배우려는 사람들에게 좋은 자료이자 저자 자신의 지식을 확고히 하면서 본인의 영역을 확장할 수 있는 방법이기도 하다. 여러분은 커뮤니티뿐만 아니라 자신의 학습을 위해 창조하는 사람들로부터 배우고 싶을 것이다. 내재적 동기를 가진 사람들은 추가로 수정하거나 표현을 정확하게 하고자 더 많은 노력을 한다.
여러분도 나처럼 이 책에서 많은 것을 배울 수 있길 바란다. 위에서 내게 ‘데이터 과학을 시작하는 사람들에게 추천할 만한 책이 있나요?’ 라는 질문을 한 분들에 대한 대답은 바로 이 책이다.
― 켄 지