1장 시작하기
_1.1 식별 가능성
_1.2 용어
_1.3 데이터 보호로서의 익명화
_1.4 실제 익명화
_1.5 마치며
2장 식별 가능성 스펙트럼
_2.1 법적 상황
_2.2 노출 위험
_2.3 재식별 과학
_2.4 전반적인 식별 가능성
_2.5 마치며
3장 실제적인 위험 관리 프레임워크
_3.1 익명화의 파이브 세이프
_3.2 파이브 세이프 연습
_3.3 마치며
4장 식별된 데이터
_4.1 요구 사항 수집
_4.2 1차 용도에서 2차 용도로
_4.3 마치며
5장 가명화된 데이터
_5.1 데이터 보호 및 법적 권한
_5.2 익명화의 첫 단계
_5.3 1차 용도에서 2차 용도로 재검토
_5.4 마치며
6장 익명화된 데이터
_6.1 식별 가능성 스펙트럼 재검토
_6.2 소스에서 익명 처리
_6.3 익명 데이터 풀링
_6.4 공급 소스 익명화
_6.5 마치며
7장 안전한 사용
_7.1 신뢰 기반
_7.2 알고리즘에 대한 신뢰
_7.3 책임 있는 AIML의 원칙
_7.4 거버넌스 및 감독
_7.5 마치며
넘쳐나는 데이터를 안전하게 운용하는 익명화 전략
AI 분야를 연구하는 가운데 다량의 데이터를 다루게 되면 데이터 활용과 개인 정보 보호 기술에 대한 관심이 높아지게 된다. 특히 저는 의료 AI 플랫폼을 개발하면서 기술 연구와 더불어 데이터 제공을 통해 개인 식별화에 대한 우려와 데이터 익명화 방법, 사회적 법률과 규정 등을 고려하지 않을 수 없다.
이 책은 전반적으로 개인 정보를 보호하는 관점에서 데이터를 어떻게 활용할지 체계적이고 실용적으로 설명하고 있다. 먼저 데이터에서 개인 정보의 노출 위험에 대한 가능성을 제기하고 이에 대한 실제적인 위험 관리 프레임워크를 활용한다. 그리고 식별된 데이터가 있다면 어떻게 처리하는지 데이터 익명화 방법에 대해 설명하고 있다. 마지막으로 데이터 사용에 있어 안정성 확보에 대한 원칙과 기술적 과제를 제시하고 있다.
_옮긴이의 말 중에서