1부. 기본 개념
1장. 머신러닝 개요
전문가 시스템
지도학습
비지도학습
강화학습
딥러닝
요약
2장. 필수 통계
무작위성 설명
확률 변수와 확률 분포
몇 가지 일반적인 분포
__연속 분포
__이산 분포
확률 변수의 집합
__기댓값
__의존성
__독립 항등 분포된 변수
추출과 복원
__복원 추출
__비복원 추출
부트스트랩
공분산과 상관관계
__공분산
__상관관계
통계가 모든 것을 말해주지는 않는다
고차원 공간
요약
3장. 성능 측정
확률의 여러 유형
__다트 던지기
__단순 확률
__조건부 확률
__결합 확률
__주변 확률
정확도 측정
__샘플 분류
__혼동 행렬
__잘못된 예측값 특성화
__옳고 그름의 측정
__정확도
__정밀도
__재현율
__정밀도-재현율 트레이드오프
__오해의 소지가 있는 측정지표
__f1 점수
__용어
__기타 측정지표
혼동 행렬을 올바르게 구성하기
요약
4장. 베이즈 규칙
빈도주의와 베이지안 확률
__빈도주의적 접근
__베이지안 접근법
__빈도주의자 대 베이지안 주의자
빈도주의자의 동전 던지기
베이지안의 동전 던지기
__동기 부여 예제
__동전 확률 그리기
__동전 던지기를 확률로 표현하기
__베이즈 규칙
__베이즈 규칙에 대한 논의
베이즈 규칙과 혼동 행렬
베이즈 규칙 반복
__사후 확률-사전 확률 루프
__베이즈 루프 실습
다중 가설
요약
5장. 곡선과 표면
함수의 본질
미분
__최댓값과 최솟값
__접선
__미분으로 최솟값과 최댓값 찾기
그래디언트
__물, 중력, 그래디언트
__경사도로 최댓값과 최솟값 찾기
__안장점
요약
6장. 정보 이론
놀라움과 맥락
__놀라움 이해
__맥락 풀기
정보 측정
적응형 코드
__모스 말하기
__모스 부호 커스터마이징
엔트로피
교차 엔트로피
__두 개의 적응형 코드
__코드 사용
__실전에서의 교차 엔트로피
쿨백-라이블
○앤드류 글래스너(지은이의 말
황금 램프를 문지르고 있다고 상상해보자.
"지니, 내 세 가지 소원으로 사랑하는 사람, 거대한 부, 길고 건강한 삶을 줘."라고 말한다.
이제 집에 들어왔다고 상상해보자. "집아, 주변에 차를 불러주고, 사라에게 점심에 시간이 있는지 물어보고, 이발 일정을 예약하고, 라떼를 만들어줘. 아, 그리고 델로니어스 몽크(Thelonious Monk를 연주해줘."라고 말한다.
이 두 가지 상황에서 당신은 거대한 힘을 가진 영혼에게 당신의 말을 듣고, 이해하고, 욕망을 채워 달라고 요구한다. 첫 번째 시나리오는 천 년 전으로 거슬러 올라가는 판타지다. 두 번째 시나리오는 인공지능 덕분에 오늘날 흔히 볼 수 있는 현실이다.
어떻게 이런 마법의 지니를 발명했을까? 오늘날 세상을 바꾸는 AI의 혁명은 세 가지 발전의 결과다.
첫째, 컴퓨터는 매년 더 커지고 빨라지고 있으며 이미지 생성을 위한 특수한 목적이 있는 칩은 이제 AI 기술에도 힘을 실어주고 있다.
둘째, 사람들은 새로운 알고리듬을 계속 개발하고 있다. 놀랍게도 오늘날 AI를 지원하는 알고리듬 중 일부는 수십 년 동안 사용돼 왔다. 이들은 누구나 알고 있는 것보다 더 강력했고 빛을 발할 수 있는 충분한 데이터와 컴퓨팅 성능을 기다리고 있었다. 더 새롭고 강력한 알고리듬은 빠른 속도로 이 분야를 발전시키고 있다. 오늘날 사용하는 가장 강력한 알고리듬 중 일부는 딥러닝이라고 하는 AI 범주에 속하며, 이 기술이 책에서 강조할 기술이다.
셋째, 가장 중요한 것은 이러한 알고리듬이 학습할 수 있는 방대한 데이터베이스가 있다는 것이다. 알고리듬은 소셜 네트워크, 스트리밍 서비스, 정부 기관, 신용카드 회사, 심지어 슈퍼마켓에서도 수집할 수 있는 모든 정보를 측정하고 저장한다. 웹상의 공개 데이터도 방대하다. 2020년 말 현재, 온라인에서 무료로 사용할 수 있는 40억 시간 이상의 비디오, 170억 개 이상의 이미지, 스포츠 역사부터 날씨 패턴, 지방 자치단체의 기록에 이르기까지 이