도서상세보기

도서명 R코딩 플러스 : 빅데이터 분석의 첫걸음
저자 장용식, 최진호
출판사 생능출판
출판일 2023-07-17
정가 30,000원
ISBN 9791192932255
수량
PART 1 R의 시작
CHAPTER 1 데이터 활용과 R
1.1 제4차 산업혁명과 인공지능
1.2 빅데이터의 활용과 데이터 리터러시
1.3 데이터 분석 도구: R

CHAPTER 2 R의 시작
2.1 R 개발환경
2.2 R 설치와 시작
2.3 RStudio 설치와 시작
2.4 R 패키지

CHAPTER 3 데이터 구조
3.1 데이터 구조의 이해
3.2 벡터와 연산자
3.3 요인
3.4 배열과 행렬
3.5 리스트
3.6 데이터 프레임
연습문제

PART 2 시각화
CHAPTER 4 그래프
4.1 그래프의 활용과 유형
4.2 막대 그래프
4.3 선 그래프
4.4 산포도
4.5 원 그래프
4.6 히스토그램
4.7 박스 플롯
연습문제
응용문제1: CDNow의 거래 데이터 분포 분석
응용문제2: 강의 길이에 대한 분포 분석
CHAPTER 5 애니메이션
5.1 애니메이션 개요
5.2 그래프 애니메이션: 막대 그래프
5.3 그래프 애니메이션: 산포도
5.4 그래프 애니메이션: 선 그래프
5.5 그래프 애니메이션: 시계열 데이터
5.6 그림 애니메이션: 양궁
연습문제
응용문제1: 애니메이션 그래프
응용문제2: 포물선으로 날아가는 화살
응용문제3: 당구공 굴리기

CHAPTER 6 지도
6.1 지도 개요
6.2 지형정보 지도
6.3 지형정보 지도를 이용한 지진 분포 파악
6.4 우리나라 행정경계 지도
6.5 행정경계 지도를 이용한 국내 지진 분포 파악
연습문제
응용문제1: 지역별 미세먼지 분포
응용문제2: 지역별 코로나 확진자 수 분포

PART 3 데이터 수집과 전처리
CHAPTER 7 웹스크래핑
7.1 웹스크래핑 개요
7.2 DOM의 이해
7.3 웹스크래핑의 기본원리
7.4 웹스크래핑 응용
연습문제
응용문제1: 지역별 미세먼지 추출
응용문제2: 지역별 코로나 확진자 수 추출

CHAPTER 8 공공 데이터 활용
8.1 공공데이터 포탈 개요
8.2 오픈
이 책의 내용과 학습 절차

이 책은 크게 R의 시작 ? 시각화 ? 데이터 수집과 전처리 ? 시뮬레이션과 데이터 분석의 4개 파트로 구성되어 있다. 첫 번째 파트인 R의 시작에서는 1장에서 4차 산업혁명 시대의 데이터 분석 사례를 통해 그 중요성을 이해하고, 데이터 분석 도구인 R의 개요를 살펴보자. 2장에서는 R과 RStudio 개발환경을 구축하고 시작하는 과정을, 3장에서는 R 데이터 구조와 데이터 세트, 그리고 함수를 통해 기초적인 문법을 익혀보자. 두 번째 파트인 시각화 파트는 데이터 분석 효과를 높이기 위해 그래프, 애니메이션, 지도 출력 방법을 알아보자. 4장에서 ggplot2 패키지를 이용한 고급 그래프를 출력하는 방법을 살펴보고, 5장에서는 그래프 애니메이션과 이미지 애니메이션을 제작해본다. 6장에서는 세계지도와 우리나라 행정지도를 이용한 지도의 활용 방법을 살펴본다. 세 번째 파트는 데이터 분석에 필요한 데이터 수집과 전처리 과정을 익히고, 7장~9장에서 웹스크래핑, 공공데이터와 네이버의 Open API를 이용한 실용적인 데이터를 수집하는 방법을 살펴보자. 또한, 10장에서 데이터 프로파일링, 데이터 정제, 데이터 병합 등의 데이터 전처리에 대해 살펴보자. 마지막 시뮬레이션과 데이터 분석 파트에서는 11장에서 복잡한 실세계의 문제를 컴퓨터 시뮬레이션으로 해결하는 원리를 이해하고, 12장에서 사회관계분석을 위한 네트워크 분석, 13장에서 인공신경망과 딥러닝의 원리를 살펴본다. 학습 절차는 시간적인 제약과 흥미에 따라 달리할 수 있을 것이다. 파트 1과 2는 R의 기초적인 내용으로 순서에 따라 학습하면 좋을 것이다. 한편, 파트 3과 4의 각 주제는 장별 순서대로 학습하거나 주제별로 선별해서 순서와 무관하게 학습할 수 있다. 다만, 8장의 공공 데이터 활용과 9장의 네이버 오픈 API 활용은 7장의 웹스크래핑 원리를 익힌 후에 학습하기를 권한다. 파트 3과 4의 각 주제는 개요, 원리 이해, 기초 실습, 응용 실습 단계로 기술하여, 학습자가 혼