전체 글
-
개인정보 비식별 조치 방법 - ℓ-다양성(ℓ-diversity)보안/개인정보 비식별화 2021. 2. 23. 16:21
ℓ-다양성(ℓ-diversity) : k-익명성의 취약점을 보완한 프라이버시 보호 모델 개념 k-익명성에 대한 두가지 공격, 즉 동질성 공격 및 배경지식에 의한 공격을 방어하기 위한 모델 정의 주어진 데이터 집합에서 함께 비식별되는 레코드들은 (동질 집합에서) 적어도 ℓ개의 서로 다른 민감한 정보를 가져야함 비식별 조치 과정에서 충분히 다양한(ℓ개 이상) 서로 다른 민감한 정보를 갖도록 동질 집합을 구성 특징 정보가 충분한 다양성을 가지므로 다양성의 부족으로 인한 공격에 방어가 가능하고, 배경지식으로 인한 공격에도 일정 수준의 방어능력 예를 들어, 표4에서 모든 동질 집합은 3-다양성(ℓ=3)을 통해 비식별되어 3개 이상의 서로 다른 정보를 가짐 공격자가 질병에 대한 배경지식이 있더라도 어느 정보의 방어..
-
개인정보 비식별 조치 방법 - k-익명성(k-anonymity)보안/개인정보 비식별화 2021. 2. 23. 16:14
k-익명성(k-anonymity) : 프라이버시 보호를 위한 기본 모델 개념 공개된 데이터에 대한 연결공격(linkage attack) 등 취약점을 방어하기 위해 제안된 프라이버시 모델 공개 데이터 취약점 : 개인정보를 포함한 공개 데이터 - 활용 정보의 일부가 다른 공개되어 있는 정보 등과 결합하여 개인을 식별하는 문제가 발생할 수 있다. 연결공격(linkage attack) - 다른 주체의 2개의 데이터 집합에서 특정 데이터에 의해 결합되면 개인의 민감한 정보가 드러날 수 있음 정의 주어진 데이터 집합에서 같은 값이 적어도 k개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없도록 함 데이터 집합의 일부를 수정하여 모든 레코드가 자기 자신과 동일한(구별되지 않는) k-1개 이상의 레코드를 가짐 특..
-
개인정보 비식별 조치 방법 - 데이터 마스킹(Data Masking)보안/개인정보 비식별화 2021. 2. 23. 16:04
개념 데이터의 전부 또는 일부분을 대체값(공백, 노이즈 등)으로 변환 대상 쉽게 새인을 식별할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보(주민등록번호, 운전면허번호 등), 기관/단체 등의 이용자 계정(등록번호, 계좌번호, 이메일 주소 등) ) 장단점 장점 : 개인 식별 요소를 제거하는 것이 가능하며, 원 데이터 구조에 대한 변형이 적음 단점 : 마스킹을 과도하게 적용할 경우 데이터 필요 복적에 활용하기 어려우며 마스킹 수준이 낮을 경우 특정한 겂에 대한 추론 가능 실무적용 방법 1. 임의 잡음 추가(Adding Random Noise) 개인 식별이 가능한 정보에 임의의 숫자 등 잡음을 추가(더하기 또는 곱하기) 하는 방법 ex) 실제 생년월일에 6개월의 잡음을 추가할 경우, 원..
-
주걱으로 라면먹기 VS 젓가락으로 죽먹기끄적끄적/생각 주머니 2021. 2. 23. 14:22
식당에서 밥을 먹다가 끝이 얇은 젓가락으로 도토리묵을 먹기 위해 사투를 벌이고 있는 광경을 목격하며 문득 엉뚱한 생각이 들었다. 배는 고픈데 적절한 식기가 없는 상황에서 끼니를 해결해야 한다면? 규칙 : 용기의 한쪽 모서리가 바닥에 붙어있는 한에서 기울이기 가능 용기에 입을 갖다대고 마시기 불가능 추가적인 조리 불가능 주걱으로 라면먹기 일단 밥주걱은 피하자. 면적이 넓지만 굴곡이 없어 국물을 퍼먹을 수 없기 때문이다. 가장 좋은 주걱은 굴곡이 가장 있는 스푼형 주걱이 아닐까 생각한다. 효율적으로 먹기 위해서 몇가지 방법을 생각을 해봤다. 라면을 주걱으로 잘게 잘라서 밥알처럼 끊어낸 다음 퍼먹는다 용기를 기울여서 잘려진 면들을 한쪽으로 몰아 주걱으로 조심스럽게 들고 입을 최대한 가까이 하여 먹는다 사실 이..
-
개인정보 비식별 조치 방법 - 데이터 범주화(Data Suppression)보안/개인정보 비식별화 2021. 2. 23. 14:19
개념 특정 정보를 해당 그룹의 대푯값으로 변환(범주화)하거나 구간값으로 변환(범주화)하여 개인 식별을 방지 대상 개인을 식별할 수 있는 정보(주소, 생년월일, 고유식별정보(주민등록번호, 운전면허번호 등), 기관/단체 등의 이용자 계정(등록번호, 계좌번호)) 장단점 장점 : 통계형 데이터 형식이므로 다양한 분석 및 가공 가능 단점 : 정확한 분석결과 도출이 어려우며, 데이터 범위 구간이 좁혀질 경우 추론 가능성 있음 실무적용 방법 1. 감추기 명확한 값을 숨기기 위하여 데이터의 평균 또는 범주값으로 변환하는 방식 단, 특수한 성질을 지닌 개인으로 구성된 단체 데이터의 평균이나 범주값은 그 집단에 속한 개인의 정보를 쉽게 추론할 수 있음 ex) 간염 환자 집단임을 공개하면서 특정인물 '갑'이 그 집단에 속함..
-
개인정보 비식별 조치 방법 - 데이터 삭제(Data Reduction)보안/개인정보 비식별화 2021. 2. 23. 13:59
개념 개인 식별이 가능한 데이터 삭제 처리 대상 개인을 식별 할 수 있는 정보(이름, 전화번호, 주소, 생년월일, 사진, 고유식별정보:주민등록번호, 운전면허번호 등, 생체정보:지문, 홍채, DNA 정보 등, 기타:등록번호, 계좌번호, 이메일주소 등) 장단점 장점 : 개인 식별요소의 전부 및 일부 삭제 처리가 가능 단점 : 분석의 다양성과 분석 결과의 유효성, 신뢰성 저하 실무적용 방법 1. 식별자 삭제 원본 데이터에서 식별자를 단순 삭제하는 방법 ex) 성명, 생년월일(yy-mm-dd)이 나열되어 있는 경우 분석 목적에 따라 생년월일을 생년(yy)으로 대체 가능하다면 월일(mm-dd) 값은 삭제 ※ 이때 남아 있는 정보 그 자체로도 분석의 유효성을 가져야 함과 동시에 개인을 식별할 수 없어야 하며, 인터..
-
개인정보 비식별 조치 방법 - 총계처리(Aggregation)보안/개인정보 비식별화 2021. 2. 23. 13:49
개념 통계값(전체 혹은 부분)을 적용하여 특정 개인을 식별할 수 없도록 함 대상 개인과 직접 관련된 날짜 정보(생일, 자격 취득일), 기타 고유 특징(신체정보, 진료기록, 병력정보, 특정소비기록 등 민감한 정보) 장단점 장점 : 민감한 수치 정보에 대하여 비식별 조치가 가능하며, 통계분석용 데이터 셋 작성에 유리함 단점 : 정밀 분석이 어려우며 집계 수량이 적을 경우 추론에 의한 식별 가능성 있음 실무적용 방법 1. 총계처리(Aggregation) 데이터 전체 또는 부분을 집계(종합, 평균 등) ※ 단, 데이터 전체가 유사한 특징을 가진 개인으로 구성되어 있을 경우 그 데이터의 대푯값이 특정 개인의 정보를 그대로 노출시킬 수도 있으므로 주의 ex) 집단에 소속된 전체 인원의 평균 나이값을 구한 후 각 개..
-
개인정보 비식별 조치 방법 - 가명처리 (Pseudonymization)보안/개인정보 비식별화 2021. 2. 23. 13:32
개념 개인 식별이 가능한 데이터를 직접적으로 식별할 수 없는 다른 값으로 대체하는 기법 대상 성명, 기타 고유 특징(출신학교, 근무처 등) 장단점 장점 : 데이터의 변형 또는 변질 수준이 적음 단점 : 대체 값 부여 시에도 식별 가능한 고유 속성이 계속 유지 실무적용 방법 1. 휴리스틱 가명화(Heuristic Pseudonymization) 식별자에 해당하는 값들을 몇 가지 정해진 규칙으로 대체하거나 사람의 판단에 따라 가공하여 자세한 개인정보를 숨기는 방법 (ex) 성명을 홍길동, 임꺽정 등 몇몇 일반화된 이름으로 대체하여 표기하거나 소속기관명을 화성, 금성 등으로 대체하는 등 사전에 규칙을 정하여 수행 식별자의 분포를 고려하거나 수집된 자료의 사전 분석을 하지 않고 모든 데이터를 동일한 방법으로 가..