들어가는 글 5
1강 통계 작업을 염두에 둔 엑셀 파일 만들기 11
2강 엑셀을 CSV 파일로 변환해서 RStudio로 불러오기 17
3강 두 그룹의 평균을 비교하기 29
4강 세 그룹 이상의 평균을 비교하는 방법 45
5강 여러 그룹에서 그룹 간 평균 비교하기(사후 검정 63
6강 그룹 간의 비율을 비교하기 77
7강 모자이크 & 막대그래프 따라 하기 95
8강 짝을 이룬 데이터 분석 개념 잡기 117
9강 동일 대상 또는 매칭된 대상에서 A약과 B약의 효과,
치료 전후의 결과 비교하기 125
10강 동일 대상 또는 매칭된 (셋 이상의 대상에서
치료 1, 2, 3개월 후의 결과 비교하기 139
11강 상관 분석 알아보기 177
12강 단순 회귀 분석 알아보기 187
13강 회귀 모형을 받아들이기 위한 기본 가정 195
14강 다중 회귀 분석 211
15강 로지스틱 회귀 분석 239
16강 푸아송 회귀 분석 263
17강 생존 분석 277
부록 1 파일 경로 마스터하기 299
부록 2 상대 위험도와 교차비의 차이 311
더 읽을 거리 317
찾아보기 319
쉬는 시간마다 코딩하던 의사,
AI와 빅 데이터 전문가가 되다.
그러나 ‘데이터가 서 말이라도 꿰어야 보배’란 업계의 격언처럼 방대하게 수집된 데이터를 활용하기 위해서는 자료 관리 기술과 분석 기술이 필수적으로 요구된다. 인공 지능의 도움을 받는다고 해도 무엇을 분석할지를 결정하는 것은 결국 사람이므로, 바야흐로 의사가 메스뿐만 아니라 컴퓨터도 잘 다루어야 하는 시대가 열린 것이다. 이를 실천하고 있는 사람이 바로 김종엽 건양 대학교 의과 대학 교수다. 우리에게 600만 방문자를 돌파한 의학 상식 블로그 ‘깜신의 작은 진료소’의 운영자나 SBS ‘자기야’, 유튜브 채널 「나는 의사다」 같은 방송에 출연했던 모습으로 더 익숙할 수 있으나, 사실 김종엽 교수는 과학 고등학교 시절부터 컴퓨터 코딩을 취미로 즐겼던 특이한 이력의 소유자였다.
의료와 IT(정보통신 기술의 융합이 화두로 떠오르던 2018년 그는 건양 대학교에서 정보 의학 교실을 처음으로 개설해 초대 주임 교수를 맡았고, 2019년에는 헬스케어 데이터 사이언스 센터를 개설해 병원에서 만들어지는 의료 데이터를 비식별화(익명화하고 외부에 공개했다. 의료 데이터의 연구적 활용 가능성을 높이고 의료 인공 지능 발전 및 인프라 조성에 기여한 이 공로를 인정받아, 김종엽 교수는 2021년 1월 과학기술정보통신부 장관상을 받기에 이른다. 이뿐만 아니라 그는 최근 보건복지부와 DNA(데이터·네트워크·인공 지능 중장기 국가 전략 및 실행 계획을 수립하고 대통령 직속 4차산업혁명위원회에서 디지털 헬스케어 특별위원회 위원을 맡기도 하는 등, 그야말로 대한민국을 선도하는 AI와 메디컬 빅 데이터 전문가로서 활약을 펼치고 있다.
빅 데이터 연구를 꿈꾸는 초보 연구자를 위한
김종엽 교수의 R 통계 분석 안내서
2021년 하반기 사이언스북스 신간으로 출간되는 『R 통계의 정석』은 김종엽 교수가 이처럼 빅 데이터 연구의 권위자로서, 빅 데이터의 올바른 활용을 위해 선결되어야만 하는 프로그래밍 언어 R의 사용법을 자신의