CHAPTER 1 SQL을 활용한 분석
1.1 데이터 분석이란
1.2 SQL을 사용하는 이유
1.3 데이터베이스 타입과 활용법
1.4 결론
CHAPTER 2 데이터 준비
2.1 데이터 타입
2.2 SQL 쿼리 구조
2.3 프로파일링: 데이터 분포
2.4 프로파일링: 데이터 품질
2.5 준비: 데이터 정제
2.6 준비: 데이터 셰이핑
2.7 결론
CHAPTER 3 시계열 분석
3.1 날짜 및 시간 데이터 조작
3.2 데이터셋: 소매업 매출
3.3 데이터 트렌드 분석
3.4 시간 윈도우 롤링
3.5 계절성 분석
3.6 결론
CHAPTER 4 코호트 분석
4.1 코호트
4.2 데이터셋: 미국 의회 입법가
4.3 리텐션
4.4 관련 코호트 분석
4.5 코호트를 활용한 크로스 섹션 분석
4.6 결론
CHAPTER 5 텍스트 분석
5.1 SQL을 활용한 텍스트 분석
5.2 데이터셋: UFO 목격 보고
5.3 텍스트 특징
5.4 텍스트 파싱
5.5 텍스트 변환
5.6 대규모 텍스트에서 문자열 찾기
5.7 텍스트 구성과 형태 변환
5.8 결론
CHAPTER 6 이상 탐지
6.1 SQL을 활용한 이상 탐지
6.2 데이터셋: 지진 발생 기록
6.3 아웃라이어 탐지
6.4 이상값의 형태
6.5 이상값 처리
6.6 결론
CHAPTER 7 실험 분석
7.1 SQL을 활용한 실험 분석
7.2 데이터셋: 모바일 게임 사용자
7.3 실험 유형
7.4 실험의 어려움과 문제 해결 방법
7.5 대체 분석 방법
7.6 결론
CHAPTER 8 복잡한 데이터셋 생성
8.1 SQL로 복잡한 데이터셋 생성하기
8.2 코드 구성
8.3 쿼리 실행 순서 구성
8.4 데이터셋 크기 및 프라이버시 관리
8.5 결론
CHAPTER 9 결론
9.1 퍼널 분석
9.2 이탈, 휴면의 정의
9.3 장바구니 분석
9.4 참고 자료
9.5 마치며
대상 독자
- SQL 문법을 학습했지만 어떻게 데이터 분석에 적용할지 막막한 사람
- 비즈니스 데이터를 분석해 업무 관련 인사이트를 도출하려는 사람
데이터로 소통하는 시대에 필살기가 되어줄 SQL 활용법
데이터로 말하고 데이터로 소통하는 시대에, 데이터 분석은 점점 선택이 아닌 필수가 되어가고 있습니다. 데이터를 다루는 사람이라면 기본으로 알아야 할 SQL은 이제 개발자나 데이터베이스 관리자뿐 아니라 다양한 비즈니스의 기획, 마케팅 등 여러 직무로 영역을 넓혀가고 있습니다. SQL을 다룰 줄 안다면 방대한 비즈니스 데이터에서 필요한 정보를 직접 추출할 수 있고, 한 단계 더 나아가 SQL이 지원하는 다양한 분석법을 활용할 줄 안다면 추출한 데이터에서 의미 있는 정보를 가려내 비즈니스에 도움이 되는 인사이트를 도출할 수 있습니다. SQL은 데이터 분석가가 필수로 갖춰야 할 역량이자, 비개발 직군이라면 업무에 깊이와 통찰을 더하고 시각을 넓혀줄 필살기가 되어줄 겁니다.
“신규 고객이 얼마나 유입됐는가?”, “판매 추이가 어떠한가?”, “왜 어떤 고객은 한번 서비스를 이용한 후 다시 돌아오지 않는 반면, 어떤 고객은 지속해서 서비스를 이용하는가?” 등 분석은 항상 질문을 던지는 데서 시작합니다. 답할 질문이 주어지고 나면 데이터가 어디에서 생성되고 어디에 저장되는지(데이터 탐색, 주어진 데이터를 어떻게 분석하고, 그 결과에서 어떻게 인사이트를 찾아낼지(데이터 분석 생각합니다.
이 책은 데이터를 분석하는 ‘쿼리와 분석’ 단계에 초점을 맞춥니다. 다양한 사례마다 적절한 쿼리 작성법을 알려주면서도 분석 워크플로 내에서 데이터를 프로파일링 및 정제하는 준비 단계도 놓치지 않습니다. 웹사이트에서 공개한 실제 데이터셋으로 쿼리를 실행해보며 시계열 분석, 코호트 분석, 텍스트 분석 등을 실무에 가깝게 실습해봅니다. 예제마다 제시하는 다양한 문제에 대한 답을 찾아가며 유용한 분석법을 학습하다 보면, 여러분에게 놓인 업무 상황에 어떤 분석법을 적용할 수