1장. 소개
1.1 본서와 부속 자료
1.2 머신러닝 모델의 종류
1.3 검증 및 테스트
1.4 데이터 정제
__일관성이 없는 기록
__원하지 않는 관측치
__중복 관측치
__특이치
__결측 데이터
1.5 베이즈 정리
__요약
__짧은 개념 질문
__연습문제
2장. 비지도학습
2.1 특성 스케일링
2.2 k - 평균 알고리즘
2.3 k 선택하기
2.4 차원의 저주
2.5 국가 위험
2.6 다른 군집화 접근 방식
2.7 주성분 분석
__요약
__짧은 개념 질문
__연습문제
3장. 지도학습: 선형과 로지스틱 회귀
3.1 선형 회귀: 한 개의 특성
3.2 선형 회귀: 여러 특성
__그래디언트 하강 알고리즘
__다항식 회귀 분석
__회귀 통계량
3.3 범주형 특성
__더미변수 함정
3.4 규제화
3.5 릿지 회귀
3.6 라쏘 회귀
3.7 일래스틱넷 회귀
3.8 주택가격 데이터 결과
3.9 로지스틱 회귀
3.10 결정 기준
3.11 신용 결정에 대한 응용
3.12 k - 최근접 이웃 알고리즘
__요약
__짧은 개념 질문
__연습문제
4장. 의사결정 트리
4.1 의사결정 트리의 성격
4.2 정보 이득 척도
4.3 신용결정에의 응용
4.4 나이브 베이즈 분류기
4.5 연속형 타깃변수
4.6 앙상블 학습
__배깅
__랜덤 포레스트
__부스팅
__요약
__짧은 개념 질문
__연습문제
5장. 지도학습: SVM
5.1 선형 SVM 분류
5.2 소프트 마진을 위한 수정
5.3 비선형 분리
5.4 연속변수 예측
__요약
__짧은 개념 질문
__연습문제
6장. 지도학습: 신경망
6.1 단일층 ANN
6.2 다층 ANN
6.3 그래디언트 하강 알고리즘
__다중 파라미터
6.4 기본방법의 변형
6.5 종료 규칙
6.6 블랙 - 숄즈 - 머튼 공식
6.7 확장
6.8 오토인코더
6.9 합성곱 신경망
6.10 순환 신경망
__요약
__
★ 지은이의 말 ★
대부분의 학생은 머신러닝의 영향력이 점점 더 커지는 세상에서 살아남으려면 머신러닝에 대한 지식이 필요하다는 것을 인지하고 있다. 오늘날, 모든 임원은 컴퓨터를 다루는 방법을 알아야 한다. 더 나아가 가까운 시일 내에 모든 임원은 생산성을 향상시키기 위해 데이터셋을 관리하고 데이터 과학 전문가들과 함께 일하는 것에 익숙해져야 한다.
이 책에서는 행렬이나 벡터 대수학을 사용하지 않았고 미적분학을 사용하지 않았다. 이러한 학문 분야들이 전문가들에게 도움을 줄 수는 있지만, 경험상 대부분의 경영대학 학생들과 경영진들은 수학적인 부분을 불편해했다. 이 책은 데이터 과학자가 가장 많이 사용하는 알고리즘을 설명한다. 이를 통해 독자는 특정 상황에 대한 장단점을 평가하고 데이터 과학 전문가와 함께 생산적으로 작업할 수 있다. 알고리즘은 다양한 데이터셋으로 설명하며, 데이터셋은 저자의 웹사이트(www-2.rotman.utoronto.ca/~hull에서 다운로드할 수 있다.
엑셀 시트와 파이썬 코드가 데이터셋을 수반한다. 실제로 내가 가르치는 모든 학생은 수업을 듣기 이전에 엑셀에 친숙하다. 저자는 학생들이 파이썬에 대해서도 편하게 다룰 수 있기를 바란다. 학생들은 이미 코딩 기술이 경영의 많은 직업의 전제조건이 되고 있음을 인지하고 있다.
저자의 웹사이트에서 수백 개의 파워포인트 슬라이드를 다운로드할 수 있다. 이 책을 채택하기로 선택한 강사들은 자신의 필요에 맞게 슬라이드를 수정할 수 있다.
★ 옮긴이의 말 ★
머신러닝이 일상용어로 사용되는 현시점에서 경영대에서는 머신러닝을 어떻게 가르쳐야 할까에 대한 의문이 있을 수 있다. 존 헐은 이 책에서 이에 대한 해답을 명쾌하게 제공한다. 본서는 다양한 고전적 머신러닝 기법뿐 아니라 신경망과 강화학습의 최신 기법들도 최소한의 수학지식으로 직관적으로 이해할 수 있도록 소개하고 있다. 파생상품 교과서로 유명한 존 헐 교수의 방식대로, 어려운 개념을 현실적인 예제와 간단한 수식으로 일반 독자들도