머리말
제1장 Data Catalog란 무엇인가?
1. Data Lake 플랫폼
2. Data Lake 플랫폼에서 Data Catalog의 역할
3. Data Catalog vs. 상품 카탈로그
4. Data Catalog의 정의
5. Data Catalog의 주요 기능
6. 기존 ‘메타데이터 관리 시스템’과의 차이점
제2장 Data Catalog는 왜 중요한가?
1. Data Lake 플랫폼의 출발점이자 관문
2. 전사 데이터의 자산화
3. 데이터 도구의 활용성 향상
4. Data Catalog의 실패는 ‘데이터 늪’
제3장 Data Catalog 주요 기능 만들기
1. 사용자 Front-End 기능
1-1. 카탈로그 검색
1-2. 카탈로그 조회
1-3. 데이터 수집 요청(VoC
1-4. 데이터 질의응답
1-5. 카탈로그 큐레이션
1-6. 실데이터 조회
1-7. 실행 스케줄러
1-8. 데이터 전처리 도구와의 연계
1-9. 데이터 분석 도구와의 연계
1-10. 용어사전 관리
1-11. My Catalog
2. Back-End 기능
2-1. 메타데이터 수집
2-2. 메타데이터 추천(M/L
2-3. 검색엔진 색인 생성
2-4. 쿼리 로그 수집/파싱
2-5. 데이터 프로파일링
2-6. 데이터 활용 현황 집계
2-7. 데이터 배치 처리
2-8. 데이터 보안 처리
3. 관리자 기능
3-1. 데이터 활용 현황판(대시보드
3-2. 카테고리 관리
3-3. 데이터 요청(VoC 처리
3-4. 데이터 Life Cycle 관리
3-5. 데이터 품질 관리
3-6. 플랫폼 보안 관리
3-7. 플랫폼 모니터링
제4장 Data Catalog 개발 절차
1. 자체 개발 vs. 솔루션 도입 의사결정
2. 단계별 구현 로드맵 수립
3. 메타데이터 구축 모듈
3-1. 대상 ‘데이터 객체’ 범위 정의
3-2. ‘데이터 Steward’ 지정
3-3. ‘데이터 객체’ 유형별 메타데이터 관리 항목 정의
순수하고 밝은 무당의 미래를 기대하며!
이 책은 《차세대 빅데이프 플랫폼 Data lake》에 이은 Data Lake 시리즈의 2편에 해당한다. Data Lake 플랫폼에서 가장 핵심적인 역할을 수행하는 ‘Data Catalog’에 관한 것, 즉 Data Catalog가 무엇인지, 왜 중요한지, 주요 기능 등에 대해 설명한다.
Data Catalog에 대한 내용부터 개발 절차, 관리자로서 알아야 할 기능, 마지막으로 Data Catalog의 미래 발전 방향까지 Data Catalog의 모든 것을 짧은 내용 안에 담고 있다.
이 책은 Data Lake 플랫폼의 가장 핵심 서비스라고 할 수 있는 Data Catalog에 대해 다루고 있기에, Data Catalog를 기획 중인 IT/DT 기획자, 시스템 구축을 준비 중인 IT/DT 부서의 담당자, 빅데이터 담당자라면 큰 도움이 될 것이다.