PART I 캐글 사용법
CHAPTER 1 캐글과 데이터 과학 대회
_1.1 데이터 과학 대회 플랫폼의 부상
__1.1.1 캐글 대회 플랫폼
__1.1.2 다른 대회 플랫폼
_1.2 캐글 소개
__1.2.1 대회의 스테이지
__1.2.2 대회의 유형과 예시
__1.2.3 제출과 리더보드 역학
__1.2.4 컴퓨팅 리소스
__1.2.5 팀 구성과 네트워킹
__1.2.6 성과 등급과 순위
__1.2.7 비판과 기회
_1.3 요약
인터뷰 | 01 - 코드를 공유하고 토론하는 커뮤니티, 캐글
인터뷰 | 02 - 프레임워크의 중요성
CHAPTER 2 캐글 데이터 세트
_2.1 데이터 세트 준비하기
_2.2 데이터 수집
_2.3 데이터 세트로 작업하기
_2.4 구글 코랩에서 캐글 데이터 세트 사용하기
_2.5 법적 주의 사항
_2.6 요약
인터뷰 | 03 - 좋은 데이터 세트를 만드는 법
CHAPTER 3 캐글 노트북
_3.1 노트북 설정하기
_3.2 노트북 실행하기
_3.3 노트북 깃허브에 저장하기
_3.4 노트북 최대로 활용하기
__3.4.1 구글 클라우드 플랫폼(GCP으로 업그레이드하기
__3.4.2 한 걸음 더 나아가기
_3.5 캐글 학습 코스
_3.6 요약
인터뷰 | 04 - 경험과 실수는 성장하는 원동력
인터뷰 | 05 - 캐글 입문자를 위한 접근법
CHAPTER 4 토론 포럼
_4.1 포럼이 운영되는 방식
_4.2 토론 접근법
_4.3 네티켓
_4.4 요약
인터뷰 | 06 - 기술에서 벗어나 맥락에서 정보를 찾아라
PART II 대회를 위한 테크닉
CHAPTER 5 대회 과제와 지표
_5.1 평가 지표와 목적 함수
_5.2 과제의 기본 유형
__5.2.1 회귀
__5.2.2 분류
__5.2.3 서수
_5.3 메타 캐글 데이터 세트
_5.4 처음 보는 지표 처리
_5.5 회귀를 위한 지표(표준과 서수
__5.5.1 평균 제곱 오차(MSE와 결정계수
캐글 그랜드마스터가 안내하는 데이터 과학의 세계
캐글은 직접 연구하며 데이터 과학 능력을 키우는 플랫폼입니다. 흔히 알려진 대회뿐 아니라 데이터 세트와 노트북, 토론 포럼 등 다양한 서비스를 사용해 여러분의 능력을 발휘할 수 있습니다. 이 책은 캐글을 통해 데이터 과학 대회에 참가하는 방법과 대회를 통해 이름을 외부에 이름을 알릴 기회를 최대한 활용하는 방법을 소개합니다. 데이터 과학 대회만이 아니라 실무에서도 사용하는 다양한 분석 기법을 소개하며, 앞으로 어떤 문제를 만나도 당황하지 않도록 유용한 팁을 담았습니다. 이렇게 단련한 실력을 선보이고 새로운 기회를 찾는 방법까지 정리해 여러분 앞에 가이드를 제시합니다. 여기에 31명의 캐글러와 나눈 인터뷰를 담아 그들이 그랜드마스터와 마스터에 오르기까지 어떤 길을 걸어왔는지, 데이터 과학에 임하는 데 무엇이 중요한지 다양한 조언을 전달합니다. 이제 막 데이터 과학을 시작했다면, 앞으로 더 나아가는 데 영감이 필요하다면 이 책이 도움이 될 겁니다. 핵심 전문 지식을 익혀 데이터 과학에서 자신만의 여정을 시작하세요.
대상 독자
- 실전에서 사용하는 데이터 과학 테크닉을 경험하고 싶은 개발자
- 머신러닝/데이터 과학 공부를 시작하고 다음 단계를 고민 중인 학습자
- 데이터 과학 분야에서 진로를 고민하는 예비 개발자
주요 내용
- 데이터 과학 대회와 프로젝트를 시작하는 방법
- 데이터 과학 플랫폼을 활용해 역량을 키우고 경력을 쌓는 방법
- 다양한 형식의 데이터를 분석하는 비기
- 다른 참가자와 소통하며 해법을 찾는 방법
- 자기 능력을 어필하는 포트폴리오를 만드는 방법