1부. 머신러닝 도입의 문제점과 MLOps의 이해(정의와 근거
1장. 머신러닝의 도전 과제
__머신러닝 이해하기
__머신러닝 가치의 실현
__올바른 접근법 선택
____데이터의 중요성
__머신러닝 도입의 도전 과제
____큰 그림에만 집착하기
____사일로 살펴보기
____빠른 실패 문화
__머신러닝 플랫폼 개요
__요약
__더 알아보기
2장. MLOps 이해하기
__머신러닝과 기존 프로그래밍의 비교
__DevOps의 장점 알아보기
__MLOps 이해하기
____머신러닝
____DevOps
____머신러닝 프로젝트 라이프사이클
____빠른 피드백 루프
____프로젝트 라이프사이클에서의 협업
__머신러닝 프로젝트에서의 OSS 역할
__쿠버네티스에서 머신러닝 프로젝트 운영
__요약
__더 알아보기
3장. 쿠버네티스 탐험
__기술 요구 사항
__쿠버네티스 주요 구성 요소 살펴보기
____제어 영역
____작업자 노드
____앱의 실행을 위한 쿠버네티스 객체
__쿠버네티스로 클라우드 사용자되기
__오퍼레이터 이해하기
__로컬 쿠버네티스 환경 설정하기
____kubectl 설치
____minikube 설치
____OLM 설치
__구글 클라우드 플랫폼의 가상머신 준비하기
__요약
2부. MLOps 플랫폼의 작업 영역과 쿠버네티스로 만드는 방법
4장. 머신러닝 플랫폼의 구조
__기술 요구 사항
__셀프서비스 플랫폼 정의
__데이터 엔지니어링 구성 요소 알아보기
____데이터 엔지니어 워크플로
__모델 개발 구성 요소 알아보기
____데이터 과학자의 워크플로 이해하기
__보안, 모니터링과 자동화
__ODH 소개
____쿠버네티스에 ODH 오퍼레이터 설치
____쿠버네티스 클러스터에 인그레스 제어기 활성화
____쿠버네티스에 Keycloak 설치
__요약
__더 알아보기
5장. 데이터 엔지니어링
__기술 요구 사항
__인증을 위한 Keycloak 설정
이 책에서 다루는 내용
- 머신러닝 프로젝트의 여러 단계별 이해
- 쿠버네티스 기반의 머신러닝 플랫폼 제작을 위한 오픈소스 소프트웨어 사용
- 머신러닝 플랫폼을 사용한 전체 머신러닝 프로젝트 구현
- 기업의 머신러닝을 위한 향상된 협업 과정
- 데이터 엔지니어, 머신러닝 엔지니어 또는 데이터 과학자 역할에 맞는 플랫폼 사용 방법
- 실제 업무 문제의 해결을 위한 머신러닝 적용 방법
이 책의 대상 독자
데이터 과학자, 데이터 엔지니어, IT 플랫폼 운영자, 인공지능 제품 서비스 책임자와 오픈소스 구성 요소로 머신러닝 플랫폼 제작을 원하는 데이터 설계 책임자를 위한 책이다. 파이썬(Python과 쿠버네티스에 대한 이해와 데이터 사이언스 및 공학에 대한 기본 개념을 갖고 있다면 이 책이 다루는 주제를 파악하는 데 큰 도움이 될 것이다.
이 책의 구성
1장에서는 머신러닝 도입의 도전 과제를 다룬다. 기업이 머신러닝을 도입하면서 만나게 될 문제점과 머신러닝의 도입 취지를 계획대로 달성하지 못하는 이유를 논의한다. 또한 기업이 이러한 문제를 만나게 되는 몇 가지 이유를 살펴본다. 2장에서는 MLOps가 무엇인지 이해한다. 1장에서 다룬 머신러닝 도입의 문제점들에 이어서 머신러닝 도입에 어려움들을 어떻게 극복할 수 있는지 논의한다. 이 장에서는 MLOps란 무엇인지 정의하고, 기업이 MLOps 도입 취지를 달성할 수 있도록 돕는다. 또한 기업이 머신러닝 프로젝트를 통해 MLOps를 어떻게 도입하는지 청사진을 제시한다. 3장에서는 쿠버네티스를 살펴본다. 이 책에서 왜 쿠버네티스를 MLOps의 플랫폼으로 선택했는지 설명한다. 또한 쿠버네티스의 핵심 개념을 정의하고 코드를 테스트하기 위한 환경을 만들 수 있도록 도와준다. 세상이 빠르게 변하는 만큼 빠른 변화에 대한 대응도 클라우드와 클라우드 기반 솔루션의 일부다. 쿠버네티스 기반의 플랫폼을 통해 독자의 솔루션이 어디서나 동작하게 만드는 유연함을 어떻게 갖추는지 알아본다.
4장은 머신러닝