개인정보 비식별 조치 가이드라인
-
개인정보 비식별 조치 방법 - t-근접성(t-closeness)보안/개인정보 비식별화 2021. 2. 23. 16:31
t-근접성(t-closeness) : 값의 의미를 고려하는 프라이버시 모델 개념 ℓ-다양성의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델 ℓ-다양성의 취약점 : 쏠림 공격 (skewness attack) 정보가 특정한 값에 쏠려 있을 경우 ℓ-다양성 모델이 프라이버시를 보호하지 못함 • 임의의 ‘동질 집합’이 99개의 ‘위암 양성’ 레코드와 1개의 ‘위암 음성’ 레코드로 구성되어 있다 가정 • 공격자는 공격 대상이 99%의 확률로 ‘위암 양성’이라는 것을 알 수 있음 유사성 공격 (similarity attack) 비식별 조치된 레코드의 정보가 서로 비슷하다면 ℓ-다양성 모델을 통해 비식별 된다 할지라도 프라이 버시가 노출될 수 있음 • 는 3-다양성(ℓ=3) 모델을 통해 비식별 된 데이터 •..
-
개인정보 비식별 조치 방법 - 데이터 마스킹(Data Masking)보안/개인정보 비식별화 2021. 2. 23. 16:04
개념 데이터의 전부 또는 일부분을 대체값(공백, 노이즈 등)으로 변환 대상 쉽게 새인을 식별할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보(주민등록번호, 운전면허번호 등), 기관/단체 등의 이용자 계정(등록번호, 계좌번호, 이메일 주소 등) ) 장단점 장점 : 개인 식별 요소를 제거하는 것이 가능하며, 원 데이터 구조에 대한 변형이 적음 단점 : 마스킹을 과도하게 적용할 경우 데이터 필요 복적에 활용하기 어려우며 마스킹 수준이 낮을 경우 특정한 겂에 대한 추론 가능 실무적용 방법 1. 임의 잡음 추가(Adding Random Noise) 개인 식별이 가능한 정보에 임의의 숫자 등 잡음을 추가(더하기 또는 곱하기) 하는 방법 ex) 실제 생년월일에 6개월의 잡음을 추가할 경우, 원..
-
개인정보 비식별 조치 방법 - 데이터 범주화(Data Suppression)보안/개인정보 비식별화 2021. 2. 23. 14:19
개념 특정 정보를 해당 그룹의 대푯값으로 변환(범주화)하거나 구간값으로 변환(범주화)하여 개인 식별을 방지 대상 개인을 식별할 수 있는 정보(주소, 생년월일, 고유식별정보(주민등록번호, 운전면허번호 등), 기관/단체 등의 이용자 계정(등록번호, 계좌번호)) 장단점 장점 : 통계형 데이터 형식이므로 다양한 분석 및 가공 가능 단점 : 정확한 분석결과 도출이 어려우며, 데이터 범위 구간이 좁혀질 경우 추론 가능성 있음 실무적용 방법 1. 감추기 명확한 값을 숨기기 위하여 데이터의 평균 또는 범주값으로 변환하는 방식 단, 특수한 성질을 지닌 개인으로 구성된 단체 데이터의 평균이나 범주값은 그 집단에 속한 개인의 정보를 쉽게 추론할 수 있음 ex) 간염 환자 집단임을 공개하면서 특정인물 '갑'이 그 집단에 속함..
-
개인정보 비식별 조치 방법 - 데이터 삭제(Data Reduction)보안/개인정보 비식별화 2021. 2. 23. 13:59
개념 개인 식별이 가능한 데이터 삭제 처리 대상 개인을 식별 할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보:주민등록번호, 운전면허번호 등, 생체정보:지문, 홍채, DNA 정보 등, 기타:등록번호, 계좌번호, 이메일주소 등) 장단점 장점 : 개인 식별요소의 전부 및 일부 삭제 처리가 가능 단점 : 분석의 다양성과 분석 결과의 유효성, 신뢰성 저하 실무적용 방법 1. 식별자 삭제 원본 데이터에서 식별자를 단순 삭제하는 방법 ex) 성명, 생년월일(yy-mm-dd)이 나열되어 있는 경우 분석 목적에 따라 생년월일을 생년(yy)으로 대체 가능하다면 월일(mm-dd) 값은 삭제 ※ 이때 남아 있는 정보 그 자체로도 분석의 유효성을 가져야 함과 동시에 개인을 식별할 수 없어야 하며, 인터..
-
개인정보 비식별 조치 방법 - 총계처리(Aggregation)보안/개인정보 비식별화 2021. 2. 23. 13:49
개념 통계값(전체 혹은 부분)을 적용하여 특정 개인을 식별할 수 없도록 함 대상 개인과 직접 관련된 날짜 정보(생일, 자격 취득일), 기타 고유 특징(신체정보, 진료기록, 병력정보, 특정소비기록 등 민감한 정보) 장단점 장점 : 민감한 수치 정보에 대하여 비식별 조치가 가능하며, 통계분석용 데이터 셋 작성에 유리함 단점 : 정밀 분석이 어려우며 집계 수량이 적을 경우 추론에 의한 식별 가능성 있음 실무적용 방법 1. 총계처리(Aggregation) 데이터 전체 또는 부분을 집계(종합, 평균 등) ※ 단, 데이터 전체가 유사한 특징을 가진 개인으로 구성되어 있을 경우 그 데이터의 대푯값이 특정 개인의 정보를 그대로 노출시킬 수도 있으므로 주의 ex) 집단에 소속된 전체 인원의 평균 나이값을 구한 후 각 개..
-
개인정보 비식별 조치 기준보안/개인정보 비식별화 2021. 2. 23. 13:23
단계별 조치사항 1. 사전 검토 (개인정보 해당 여부 검토) 빅데이터 분석 등을 위해 정보를 처리하려는 사업자 등은 해당 정보가 개인정보인지 여부에 대해 아래 기준을 참조하여 판단 해당 정보가 개인정보에 해당하지 않는 것이 명백한 경우에는 별도 조치 없이 빅데이터 분석 등에 활용 가능 더보기 [ 참고 ] 개인정보 해당 여부 판단 기준 가. 개인정보 보호법 등 관련 법률에서 규정하고 있는 개인정보의 개념은 다음과 같으며, 이에 해당하지 않는 경우에는 개인정보가 아님 나. 개인정보는 ⅰ)살아 있는 ⅱ)개인에 관한 ⅲ)정보로서 ⅳ)개인을 알아수 있는 정보이며, 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 ⅴ)다른 정보와 쉽게 결합하여 알아볼 수 있는 정보를 포함 ⅰ) (살아있는) 자에 관한 정보이어야 하..