-
개인정보 비식별 조치 방법 - 데이터 마스킹(Data Masking)보안/개인정보 비식별화 2021. 2. 23. 16:04
개념
- 데이터의 전부 또는 일부분을 대체값(공백, 노이즈 등)으로 변환
대상
- 쉽게 새인을 식별할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보(주민등록번호, 운전면허번호 등), 기관/단체 등의 이용자 계정(등록번호, 계좌번호, 이메일 주소 등) )
장단점
- 장점 : 개인 식별 요소를 제거하는 것이 가능하며, 원 데이터 구조에 대한 변형이 적음
- 단점 : 마스킹을 과도하게 적용할 경우 데이터 필요 복적에 활용하기 어려우며 마스킹 수준이 낮을 경우 특정한 겂에 대한 추론 가능
실무적용 방법
1. 임의 잡음 추가(Adding Random Noise)
- 개인 식별이 가능한 정보에 임의의 숫자 등 잡음을 추가(더하기 또는 곱하기) 하는 방법
ex) 실제 생년월일에 6개월의 잡음을 추가할 경우, 원래의 생년월일 데이터에 1일부터 최대 6개월의 날짜가 추가되어 기존의 자료와 오차가 날 수 있도록 적용 - 지정된 평균 분산의 범위 내에서 잡음이 추가되므로 원 자료의 유용성을 해치지 않으나, 잡음값은 데이터 값과는 무관하기 때문에 유효한 데이터로 활용하기 곤란
- 적용정보 : 사용자 ID, 성명, 생년월일, 키, 나이, 병명 코드, 전화번호, 주소 등
2. 공백(blank)과 대체(impute)
- 특정 항목의 일부 또는 전부를 공백 또는 대체분자('*', '_' 등이나 전각 기호로 바꾸는 기법
ex) 생년월일 '1999-09-09' -> '19 -- -- ' 또는 '19**-**-**' - 적용정보 : 성명, 생년월일, 전화번호, 주소, 사용자 ID 등
'보안 > 개인정보 비식별화' 카테고리의 다른 글
개인정보 비식별 조치 방법 - ℓ-다양성(ℓ-diversity) (0) 2021.02.23 개인정보 비식별 조치 방법 - k-익명성(k-anonymity) (0) 2021.02.23 개인정보 비식별 조치 방법 - 데이터 범주화(Data Suppression) (0) 2021.02.23 개인정보 비식별 조치 방법 - 데이터 삭제(Data Reduction) (0) 2021.02.23 개인정보 비식별 조치 방법 - 총계처리(Aggregation) (1) 2021.02.23