01장. 데이터베이스 신뢰성 엔지니어링 소개
__DBRE의 원칙
____데이터 보호
____확장을 위한 셀프 서비스
____잡일 제거
____데이터베이스는 더 이상 특별한 스노우플레이크가 아니다
____소프트웨어와 운영 사이의 장벽 제거
__운영 핵심 개요
__욕구 단계
____생존과 안전
____사랑과 소속
____존중
____자아실현
__정리
02장. 서비스 수준 관리
__서비스 수준 목표가 필요한 이유
__서비스 수준 지표(SLI
____대기시간
____가용성
____처리량
____내구성
____비용과 효율성
__서비스 목표 정의
____대기시간 지표
____가용성 지표
______가용성에서의 회복 탄력성(resiliency과 강건성(robustness
______다운타임을 허용하는 설계
____처리량 지표
______비용 효과적인 지표
______고려 사항
__SLO 관점의 모니터링과 리포팅
____가용성 모니터링
____대기시간 모니터링
____처리량 모니터링
____비용과 효율성 모니터링
__정리
03장. 위험 관리
__위험 고려 사항
____알 수 없는 요인과 복잡성
____리소스 가용성
____인적 요인
____그룹 요인
__해야 할 것
__하지 말아야 할 것
__작업 프로세스: 부트스트래핑
____서비스 위험 평가
____아키텍처 인벤토리
____우선순위 지정
______심각한 영향(즉각적인 SLO 위반
______중대한 영향(SLO 위반에 임박
______보통의 영향
______사소한 영향
______통제와 의사결정
______식별
______평가
______완화와 제어
______구현
__지속적인 반복
__정리
04장. 운영 가시성
__운영 가시성의 새로운 규칙
____BI 시스템처럼 OpViz 시스템 처리
____표준에 따른 분산 임시 환경의 트렌드
____주요 지표의 고해상도 저장
____간소화 아키
ㆍ 이 책에서 다루는 내용
- 서비스 레벨 요구사항과 위험 관리
- 운영 가시성을 위한 아키텍처 구축 및 진화
- 인프라 엔지니어링 및 관리
- 릴리스 프로세스를 원활하게 수행하는 방법
- 데이터 저장, 인덱싱, 복제
- 데이터 스토어의 특성 식별과 모범 사례
- 데이터 스토어 아키텍처의 구성 요소와 데이터 기반의 아키텍처
ㆍ 이 책의 대상 독자
데이터 스토어의 설계, 구축, 안정적인 운영에 흥미가 있는 모든 사람을 대상으로 한다. 독자는 데이터베이스의 지식을 넓히려고 하는 소프트웨어 엔지니어 혹은 같은 이유를 가진 시스템 엔지니어일 수도 있다. 스킬 향상을 원하는 데이터베이스 전문가라면 여기서 가치를 발견할 것이고, 이 업계에 새로 들어온 사람이라면 확실한 이해를 줄 수 있을 것이다.
ㆍ 이 책의 구성
1장은 데이터베이스 신뢰성 엔지니어링(database reliability engineering의 개념을 소개한다. 원칙을 안내하는 것에서 출발해 운영 중심부로 넘어가고 마지막으로 매슬로우의 욕구 계층(Maslow’s hierarchy of needs을 기반으로 DBRE의 비전을 구축하기 위한 프레임워크를 제시한다.
2장에서는 서비스 수준 요구 사항(service level requirements을 설명한다. 이는 제품을 위한 기능 요구 사항만큼이나 중요하다. 이 장은 서비스 수준 요구 사항이 무엇이고 어떻게 그것을 정의하는지 알아본다. 이후에는 이러한 요구 사항을 측정하고 처리하는 방법을 살펴본다.
3장에서는 위험 평가와 관리(risk assessment and management를 알아본다. 위험의 기초적인 측면을 설명하고 난 후 시스템 및 데이터베이스 엔지니어링에 위험 평가를 접목시키기 위한 실전 프로세스를 살펴본다. 또한 함정과 복잡성도 살펴본다.
4장에서는 운영 가시성(operational visibility을 다룬다. 지표(metric와 이벤트를 이야기하고 이를 측정하기 위한 계획을 어떻게 세우는