Chapter 01 Why: Weka를 사용하는 이유
1.1 왜 데이터 분석인가? 임계의 가시화
1.2 왜 자바 머신러닝인가? Web → 모바일 → 분석(?
1.3 왜 Weka인가? 무료/쉽고/신속 적용 가능
1.3.1 장점: 무료/쉽고/신속 적용 가능
1.3.2 단점: 메모리 문제, 무료 s/w 한계, 한글 인코딩
1.4 먼저 알아야 할 2개 지표(정분류율, 상관계수
Chapter 02 What: 설치 프로그램
2.1 jre/jdk(Open JDK
2.2 Weka 3.8.3 또는 Weka 3.9.3
2.3 Eclipse
2.4 다운로드 자료 강의 활용
Chapter 03 What: Weka 3.9.3
3.1 Weka
3.1.1 DIKW 관점 활용(why
3.1.2 Weka 소개(what
3.1.3 본서 구성(how
3.1.4 학습 기대 효과(IF
3.2 학습 방법 예시
3.2.1 실습: LinearRegression 알고리즘, regression_outliers.csv/arff 데이터셋
3.2.2 KnowledgeFlow 설계
3.2.3 Explorer 실습
3.2.4 Java 프로그래밍: W5_L1_OutlierWithCSV.java
Chapter 04 How: Weka 사용(전반
4.1 인트로: arff 포맷, 필터링, 알고리즘, 시각화
4.1.1 소개
4.1.2 KnowledgeFlow
4.1.3 Explorer 사용
4.1.4 Datasets 살펴보기
4.1.5 분류 알고리즘 학습하기
4.1.6 필터 사용하기
4.1.7 Dataset을 시각화로 확인하기
4.2 모델평가
4.2.1 모델평가를 먼저 설명하는 이유
4.2.2 분할검증(Holdout: 훈련 데이터와 테스트 데이터를 처음부터 나눠서 검증한다
4.2.3 RandomSeed: 무작위로 데이터를 훈련과 테스트 데이터로 나눠 검증한다
4.2.4 가장 성능이 낮은 ZeroR 알고리즘보다 정분류율이 높은지 비교한다
4.2.5 n
이 책의 특징
- 머신러닝을 아는 도메인 전문가와 코딩을 아는 자바 개발자 간 협업 체계 구축
- 코딩 없는 머신러닝이 가능한 Weka 학습
- Weka Explorer, Experimenter, Knowledge Flow 사용을 통한 상호 유기적인 연계
이 책이 필요한 독자
- 코딩을 모르는 도메인 전문가 및 머신러닝 기획자
- Java 실무 1년 이상 개발자
- Weka Experimenter, Knowledge Flow 사용법 습득을 원하는 분
독자대상
초중급
소스코드 다운로드
https://github.com/bjpublic/weka
인터넷과 모바일 혁명이 도래하면서 수많은 IT 시스템들이 탄생했고 상당한 IT 시스템들이 Java로 구축되었습니다. R과 파이썬으로 구축된 데이터 분석 모듈이 Java에서 돌아가기 위해서는 이기종 간의 데이터 연동이 필요하고 구축 비용이나 투입되는 인력도 더 많이 소요될 것입니다. 그렇다고 java로 구축된 IT 시스템을 버리고 파이썬으로 고치는 것은 천문학적인 비용이 들어갈 수 있습니다.
Weka는 다양한 UI를 제공하고 코딩을 몰라도 기본적인 머신러닝이 가능하며, 설계 후에 머신러닝을 배포하고 시스템에 체계화하기 위한 Java 코딩까지 가능하도록 해줍니다. 앞으로 데이터 분석에서 코딩이란 보이지 않는 장벽 때문에 개발자들이 과도한 작업 시간을 강요받지 않도록, 이 책이 Java로 순조롭게 데이터 분석 기술을 전달할 수 있는 환경을 만들기를 기대합니다.