차등의 의미 차등 정보보호(Differential Privacy)에서 '차등(differential)'이라는 단어는 '차이(difference)'를 의미하며, 데이터베이스에 특정 개인의 데이터가 포함되거나 포함되지 않았을 때, 또는 변경되었을 때 발생하는 ' 결과의 차이를 제어 '하는 기술의 핵심 개념을 직접적으로 나타냅니다. 이 용어는 2006년 컴퓨터 과학자 신시아 드워크(Cynthia Dwork)가 발표한 논문 "Differential Privacy"에서 처음으로 공식화되었습니다. 이 개념의 핵심은 데이터베이스에 대한 질의(query) 결과가 특정 개인의 데이터 유무, 또는 변경에 따라 크게 달라지지 않도록 보장하는 것입니다. 즉, 데이터베이스에서 한 사람의 정보를 추가, 삭제, 또는 변경하더라도 분석 결과에 미치는 영향(차이)이 거의 없도록 만드는 것이 목표입니다. 이는 데이터에 임의의 노이즈(noise)를 추가하여 달성되며, 이 노이즈의 크기는 개인 데이터의 유무나 변경에 따른 결과값의 차이를 감출 수 있을 만큼 크지만, 전체 데이터의 통계적 유의미성은 해치지 않을 만큼 작게 설정 됩니다. 수학적 정의 어떤 무작위화 알고리즘 M이 ε-차등 정보보호를 만족한다는 것은, 단 하나의 데이터만 다른 임의의 두 인접 데이터셋 D1과 D2에 대해, 알고리즘 M이 출력할 수 있는 모든 결과의 집합 S에 속하는 특정 결과 O가 나올 확률이 다음 부등식을 만족한다는 의미입니다. $$ \frac {P(M\left({D}_1\right)=O)} {P(M\left(D_2\right)=O)} \le {e}^{\epsilon} $$ 알고리즘 M: 데이터를 입력받아 무작위화된 결과를 출력하는 함수 인접 데이터셋 D1, D2: 단 한 사람의 정보만 다른 데이터셋 결과 O: 알고리즘이 출력하는 값 ε(엡실론): 프라이버시 손실(Privacy Loss). 이 값이 작을수록 프라이버시 보호 수준이 높습니다.