-
개인정보 비식별 조치 방법 - 데이터 삭제(Data Reduction)보안/개인정보 비식별화 2021. 2. 23. 13:59
개념
- 개인 식별이 가능한 데이터 삭제 처리
대상
- 개인을 식별 할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보:주민등록번호, 운전면허번호 등, 생체정보:지문, 홍채, DNA 정보 등, 기타:등록번호, 계좌번호, 이메일주소 등)
장단점
- 장점 : 개인 식별요소의 전부 및 일부 삭제 처리가 가능
- 단점 : 분석의 다양성과 분석 결과의 유효성, 신뢰성 저하
실무적용 방법
1. 식별자 삭제
- 원본 데이터에서 식별자를 단순 삭제하는 방법
ex) 성명, 생년월일(yy-mm-dd)이 나열되어 있는 경우 분석 목적에 따라 생년월일을 생년(yy)으로 대체 가능하다면 월일(mm-dd) 값은 삭제
※ 이때 남아 있는 정보 그 자체로도 분석의 유효성을 가져야 함과 동시에 개인을 식별할 수 없어야 하며, 인터넷 등에 공개되어 있는 정보 등과 결합하였을 경우에도 개인을 식별할 수 없어야 함 - 적용정보 : 성명, 전화번호, 계좌번호, 카드번호, 요양기관번호, 이메일 주소 등
2. 식별자 부분삭제
- 식별자 전체를 삭제하는 방식이 아니라, 해당 식별자의 일부를 삭제하는 방법
ex) 상세 주소의 경우 부분 삭제를 통하여 대표지역으로 표현
(서울특별시 송파구 가락본동 78번지 -> 서울시 송파구) - 수치 또는 텍스트 데이터 등에도 폭넓게 활용 가능
- 적용정보 : 주소, 위치정보(GPS), 전화번호, 계좌번호 등
3. 레코드 삭제(Reducing Records)
- 다른 정보와 뚜렷하게 구별되는 레코드 전체를 삭제하는 방법
ex) 소득이 다른 사람에 비하여 뚜렷이 구별되는 값을 가진 정보는 해당 정보를 전체 삭제 - 이 방법은 통계분석에 있어서 전체 평균에 비하여 오차범위를 벗어나는 자료를 제거할 때에도 사용 가능
- 적용정보 : 키, 소득, 질병, 카드지출액 등
4. 식별요소 전부삭제
- 식별자뿐만 아니라 잠재적으로 개인을 식별할 수 있는 속성자까지 전부 삭제하여 프라이버시 침해 위험을 줄이는 방법
ex) 연예인/정치인 등의 가족정보(관계정보), 판례 및 보도 등에 따라 공개되어 있는 사건과 관련되어 있음을 알 수 있는 정보 등 잠재적 식별자까지 사전에 삭제함으로써 연관성 있는 정보의 식별 및 결합을 예방 - 개인정보 유출 가능성을 최대한 줄일 수 있지만 데이터 활용에 필요한 정보까지 사전에 모두 없어지기 때문에 데이터의 유용성이 낮아지는 문제 발생
- 적용정보 : 나이, 신장, 소득, 질병, 신용등급, 학력 등
'보안 > 개인정보 비식별화' 카테고리의 다른 글
개인정보 비식별 조치 방법 - 데이터 마스킹(Data Masking) (0) 2021.02.23 개인정보 비식별 조치 방법 - 데이터 범주화(Data Suppression) (0) 2021.02.23 개인정보 비식별 조치 방법 - 총계처리(Aggregation) (1) 2021.02.23 개인정보 비식별 조치 방법 - 가명처리 (Pseudonymization) (0) 2021.02.23 개인정보 비식별 조치 기준 (0) 2021.02.23