머리말
왜 이 책을 쓰게 되었는가?
이 책은 어떤 내용을 담고 있는가?
이 책은 어떤 사람들을 대상으로 하는가?
내용상의 한계점
감사의 말
제1장 Introduction
1. 데이터 분석 플랫폼 발전 과정
2. Data Lake 구축 방식 선정
3. Data Lake 추진 로드맵 수립
4. Data Lake 아키텍처 설계
5. Data Lake 플랫폼 활용도 향상
6. Data Lake 거버넌스
7. Data Lake 추진 조직
제2장 Data Lake란 무엇인가?
1. Data Lake의 개념
2. Data Lake의 기원
3. Data Lake vs. Data Warehouse
4. Data Lake vs. 빅데이터(Hadoop 플랫폼
5. Data Lake vs. Data Puddle/Pond
6. Data Lake vs. Data Swamp
7. Data Lake의 지향점
제3장 Data Lake는 어떻게 구축해야 하는가?
1. Data Lake 구현 방식: On-Premise vs. Cloud
2. Data Lake 구축 로드맵
3. Data Lake 목표 아키텍처
4. 데이터 수집 Layer
5. 데이터 적재 Layer
6. 데이터 제공 Layer
7. 데이터 서비스 Layer
1 데이터 검색
2 데이터 Context 이해
3 데이터 확보
4 타 서비스 연계
8. Data Catalog 솔루션
제4장 ?Data Lake를 잘 활용하기 위한 방안은 무엇인가?
1. Data Lake의 타깃을 일반 사용자로 할 것(UI/UX 측면
2. 기존 사용자들이 많이 활용하는 도구와 연계
3. 데이터 큐레이션의 우선순위화
4. 게임화(Gamification의 도입
5. 빅데이터 과제와 연계 추진
6. 전사적 전환(Transformation 프로그램
제5장 Data Lake 거버넌스
1. 데이터 품질 관리
2. 보안 관리
3. 데이터 수명 주기 관리
결론
향후 발
Data Lake의 구축방법과 활용 방안
Data Lake의 모든 것
Data Lake는 무엇인가, 그 개념을 알아보는 것부터 잘 활용하기 위한 방안까지 Data Lake의 모든 것을 제시한다. 국내의 대부분의 대기업은 ‘데이터 웨어하우스’를 운영 중에 있고 Hadoop 기반의 빅데이터를 구축하여 업무에 적용하는 사례를 확대하고 있다. Data Lake는 차세대 전사 데이터 플랫폼이 되어야 하는 시점에 있다.
Data Lake는 국내에서는 아직 생소한 개념이다. 이 책은 Data Lake에 대해 들어 보기는 했으니 무엇인지 잘 모르는 IT 업계의 실무자, Data Lake에 대한 시장 조사와 도입을 검토 중인 기업, Data Lake를 기획 중이거나 구축 후 운영 중에 있는 기업의 실무자와 경영진을 대상으로 한다.