1장 캐글 소개
01 캐글이란 무엇인가
캐글이란
캐글링하기
02 캐글 활용 사례
데이터 분석 인프라로 활용하기
회사 연수에 활용하기
캐글러에게 질문하기
03 다양한 경진 대회
학습용 경진 대회
정기 경진 대회
특수한 데이터를 다루는 경진 대회
특수한 규칙을 따르는 경진 대회
2장 캐글 시작하기
04 캐글 첫걸음
캐글 계정 만들기
캐글의 교육 과정 경험하기
05 캐글 컨트리뷰터 되기
캐글의 사용자 프로필 페이지
캐글러 등급
컨트리뷰터
캐글러의 교류
경진 대회 참가하기
컨트리뷰터가 되었는지 확인하기
3장 노트북 자유자재로 다루기
06 노트북
SaaS 기반 머신러닝 개발 환경
07 노트북 사용하기
스크립트 타입으로 사용하기
노트북 타입으로 사용하기
08 노트북 능숙하게 다루기
노트북 설정하기
데이터 세트 사용하기
외부 코드 사용하기
4장 캐글의 경진 대회
09 경진 대회와 노트북
경진 대회에서 노트북의 역할
경진 대회의 진행 흐름에 따른 노트북 분류
10 다양한 경진 대회
다양한 경진 대회 소개
공개 노트북 중심으로 경진 대회 살펴보기
실제 경진 대회의 진행 흐름
경진 대회 노트북의 발전 흐름
11 경진 대회의 세부 사항
경진 대회의 세부 사항이 중요한 이유
경진 대회의 별도 규칙
경진 대회 종료 후
5장 캐글 마스터 지향하기
12 경진 대회 규칙 이해하기
경진 대회 규칙 확인하기
노트북 전용 경진 대회
노트북 전용 경진 대회 사례
노트북 전용 경진 대회의 특별 규칙
13 데이터를 더 잘 이해하기
데이터를 잘 이해해야 하는 이유
Santander Value Prediction Challenge 사례 살펴보기
14 최신 기술 살펴보기
종료한 경진 대회에서 기술 흐름 살펴보기
머신러닝 모델의 튜닝 방법 살펴보기
15 캐글 제대로 활용하기
공개 데이터 세트 활용하기
데이터 세트에서
경진 대회 플랫폼으로 유명한 캐글의 여러 가지 활용 방법을 경험하자!
머신러닝, 딥러닝, 데이터 과학의 기초를 어느 정도 익혔다고 생각해보죠. 그럼 실전 혹은 실전에 가까운 사례를 경험하면서 자신의 실력을 향상시킬 기회가 필요합니다. 그러려면 내가 해결해야 할 문제도 있어야 하고, 여러 가지 데이터 세트를 확보해야 하며, 최신 기술도 찾아봐야 하고, 멘토도 있어야 합니다. 상황에 따라서는 GPU를 탑재한 성능 좋은 하드웨어도 필요합니다.
실제로 이 책과 함께 편집자가 경험한 캐글은 방금 소개한 요소가 한꺼번에 모여 있는 공간이었습니다. 그래서 많은 데이터 과학자가 앞으로 주목해야 할 것으로 생각합니다. 기존 개발자들에게 스택 오버플로가 있었다면 데이터 과학자에게는 앞으로 캐글이 그 역할을 하지 않을까 조심스레 예측합니다.
이 책은 데이터 과학자가 캐글이라는 플랫폼을 잘 이해하도록 소개하는 가이드라고 말하고 싶습니다. 솔직히 말하면 데이터 과학과 관련한 기초 지식을 알려준다거나, 경진 대회에 상위 입상하는 비법을 알려주지는 않습니다. 하지만 데이터 과학자가 효율적으로 캐글을 활용할 수 있는 여러 가지를 알려준다는 장점이 있습니다. 만약 데이터 과학은 어느 정도 공부했지만 캐글을 어떻게 접근하고 참여할지를 잘 몰랐다면 이 책과 함께 캐글을 시작하기 바랍니다.
이 책에서 배우는 내용
● 캐글 컨트리뷰터되기(캐글 튜토리얼 완료하기
● 캐글의 주요 서비스인 경진 대회, 데이터 세트, 노트북, 토론 경험하고 이해하기
● 캐글이라는 플랫폼을 활용해 데이터 과학과 관련된 지식 얻기
● 경진 대회의 성격과 진행 흐름 이해하기
● 내 머신러닝 개발 환경으로 캐글을 활용하는 노트북이나 API 활용 방법 살펴보기