4차 산업혁명을 추동하는 핵심 분야에서 사용되는 많은 기법들은 본질적으로 통계학의 이론적인 체계에 기초하고 있다. 대부분의 기법은 대용량 데이터를 효과적으로 처리하기 위해 컴퓨터의 연산능력과 잘 짜인 알고리즘을 활용하지만 근본적으로는 통계 이론에 뿌리를 두고 있는 것이다. 그럼에도 오늘날의 많은 통계교육이 이론적인 개념과 원리를 등한시하고 소프트웨어 사용법 위주로 이루어지고 있어서 분석 방법이 잘못되거나 분석 결과를 잘못 해석할 우려가 크다.
저자들은 과거 컴퓨터에 의한 결과는 항상 올바르고 정확할 것이라는 잘못된 환상이 주었던 교훈을 이 시점에서 통계 교육에 비추어볼 필요가 있다는데 인식을 같이 하고 적절한 교재의 출판을 기획하게 되었다. 이 책은 통계 이론에 충실한 저서 《통계학의 이론과 응용》(배도선, 이낙영, 권혁무, 장중순, 차명수, 윤원영, 김명수, 이민구 공저을 기본으로 현대적인 요구사항을 반영하여 저작되었다. 먼저 이론적인 강점을 살리면서 계산을 위한 간단한 R 프로그램들을 추가하여 차후 컴퓨터를 이용한 대용량 데이터의 처리에 도움이 되도록 하였다. 또한 모집단의 참 모습을 파악하기 위한 모형의 설정과 데이터 분석 부분을 보완하였다. 전체 이론적인 체계로 보아서는 기존저서를 보다 쉽게 정리한 개정판으로 볼 수 있다.
이 책의 장과 절은 기존저서의 전개 방식을 보다 쉽게 바꾸고 컴퓨터를 활용한 데이터분석의 필요성을 감안하여 부분부분 적절하게 보완하는 형식으로 구성되어 있다. 1장 서론에서는 통계학의 본질적인 목표가 데이터분석을 통해 모집단의 참 모습을 파악하는 데 있음을 이해하는 데 초점을 맞춘다. 또한 책의 앞부분인 2장에서 자료의 정리와 요약에 관해 소개함으로써 데이터분석에 보다 쉽고 친숙하게 접근할 수 있도록 한다. 3장부터 7장까지는 통계적 방법의 토대가 되는 확률과 분포를 다룬다. 8장과 9장은 통계적 추론의 기본적인 이론을 소개하고 10장과 11장에서는 가장 널리 응용되는 데이터의 구조모형으로 회귀모형과 분산분석모형에 대해 기술한다.