CHAPTER 1. AWS 소개
__1.1 클라우드 서비스
__1.2 클라우드 요금 제도
__1.3 고객 지원과 마케팅
____AWS re:Invent
____AWS Summit
____AWS TechConnect
____AWS Transformation Days
____AWS Online Tech Talks
____오픈소스
____API & SDK
____AWS 교육과 자격증
__1.4 지속적인 서비스 진화
__1.5 글로벌 가용성
__1.6 시스템 보안
__1.7 정리
CHAPTER 2. 레드시프트 시작하기
__2.1 Amazon Redshift
____레드시프트의 특징
____레드시프트 포지셔닝
__2.2 시작하기
____AWS 웹 콘솔 접속
____레드시프트 클러스터 생성
____노드 유형
__2.3 접속하기
____데이터베이스 툴
____JDBC 접속
____ODBC 접속
____Python 접속
____CLI 접속
__2.4 레드시프트 아키텍처
____시스템 아키텍처
____데이터 분산
____데이터 저장
__2.5 정리
CHAPTER 3. 데이터 최적화
__3.1 실습 데이터 적재
__3.2 테이블 생성
____CREATE TABLE
____CREATE TABLE AS
____CREATE TABLE LIKE
____CREATE TEMP TABLE
____CREATE TABLE IF NOT EXISTS
____테이블 생성 제약 사항
__3.3 컬럼
____데이터 자료형
____컬럼 인코딩
__3.4 데이터 분산
____테이블 분산 방식
____테이블 분산 방식 선택하기
__3.5 소트키
____존맵(Zone Map
____컴파운드 소트키(COMPOUND SORT KEY
____인터리브 소트키(INTERLEAVED SORT KEY
____소트키 유형 선택하기
__3.6 데이터 적재와 추출
____C
★ 이 책의 대상 독자 ★
AWS에서 레드시프트를 처음 들어본 사용자부터 레드시프트를 사용해 AWS 내에서 데이터 웨어하우스를 구축하고자 하는 데이터 엔지니어까지 모두 참고할 수 있다. 기존 데이터베이스 관련 지식이 있다면 아마존 레드시프트에서 다른 아키텍처를 어떻게 사용해야 성능의 이점을 최대화할 수 있는지 참고할 수 있다. 데이터베이스 관련 지식이 부족하더라도 기본적인 쿼리 사용법부터 레드시프트 구조까지 자세히 설명하기 때문에 기초 사용자의 레드시프트를 사용 길잡이가 돼줄 것이다. AWS 클라우드에서 데이터 웨어하우스 및 데이터레이크를 구축하고자 하는 엔지니어라면 레드시프트의 특징을 기반으로 저자의 많은 시행착오와 경험에서 나오는 팁들을 참고할 수 있으며, 이 책이 앞으로 겪게 될 폭풍 속의 등대가 돼줄 것이다. 또한 클라우드에 시스템을 구축하는 만큼 얼마나 적은 비용으로 최대한의 효과를 낼 수 있는가에 초점을 맞추고 있다. 아마존 레드시프트를 사용할 때의 여러 팁을 사용자의 환경에 맞춰 적용함으로써 비용 효율적인 시스템을 구축할 수 있도록 안내할 것이다.
★ 이 책의 구성 ★
각 장에서 다루는 내용은 레드시프트 클러스터 구축 과정 순서로 구성했다. 독자에 따라 필요한 장만 읽어볼 수도 있지만 설치형 데이터 웨어하우스와 다르게 클라우드 데이터 웨어하우스에서는 시스템 관리자와 데이터 제공자, 분석가의 경계가 미미하다. 시스템 관리자와 데이터 제공자는 분석가의 쿼리를 잘 알고 있어야 하며, 분석가는 클러스터와 데이터 구성을 잘 이해하고 있어야 최적화된 쿼리 성능을 발휘할 수 있다. 따라서 사용자 역할에 상관없이 처음부터 끝까지 읽기를 권장한다.
1장. AWS 소개
아마존 레드시프트를 다루기 전에 AWS 서비스의 간략한 소개와 출시 배경을 다룬다.
2장. 레드시프트 시작하기
AWS를 처음 접하거나 레드시프트 클러스터를 처음 생성한다면 생성 과정에 등장하는 용어와 옵션이 생소할 것이다. 레드시프트 시스템 아키텍처를 설명하고 AWS