데이터 처리 방식에 따른 분류 데이터에 직접 적용되어 프라이버시를 보장하는 핵심 알고리즘들입니다. 노이즈 추가 차등 정보보호에서 가장 보편적으로 사용되는 기법입니다. 핵심 원리는 데이터베이스에 대한 통계적 질의(Query)의 결과값 에 수학적으로 생성된 '노이즈(noise)'라고 불리는 무작위 숫자 를 더하여, 개별 데이터의 기여도를 모호하게 만드는 것입니다. 작동 원리 쿼리 실행 : 데이터 분석가가 데이터베이스에 쿼리(예: "30대 사용자들의 평균 소득은 얼마인가?")를 실행하면, 시스템은 먼저 실제 결과값을 계산합니다. 민감도(Sensitivity) 계산 : 쿼리 결과가 데이터베이스 내의 단 한 사람의 데이터 변화에 의해 얼마나 크게 변할 수 있는지를 측정합니다. 예를 들어, 한 사람의 데이터를 추가하거나 제거했을 때 평균 소득의 최댓값 변화가 '민감도'가 됩니다. 민감도가 높을수록 더 많은 노이즈가 필요합니다. 노이즈 생성 및 추가 : 계산된 민감도와 목표 프라이버시 수준(엡실론, ε)에 따라 노이즈의 크기가 결정됩니다. 이 노이즈를 실제 쿼리 결과에 더하여 최종 결과를 만듭니다. 대표적인 노이즈 메커니즘 라플라스 메커니즘 (Laplace Mechanism) : 평균, 합계, 개수 등 수치형 결과 를 반환하는 쿼리에 주로 사용됩니다. 민감도에 비례하는 라플라스 분포에서 추출된 노이즈를 추가합니다. 가우시안 메커니즘 (Gaussian Mechanism) : 라플라스 메커니즘과 유사하지만, 정규분포(가우시안 분포)에서 노이즈를 추출합니다. 여러 쿼리를 조합하거나 머신러닝 모델의 학습 파라미터를 보호하는 등 더 복잡한 분석에 적합합니다. 결론적으로, 노이즈 추가 기법은 분석 결과에 약간의 불확실성을 주입하여 "이 결과가 특정 개인의 정보 때문에 이렇게 나온 것"이라고 확신할 수 없게 만듦으로써 개인의 프라이버시를 보호합니다. 무작위 응답 주로 설문조사와 같이 사용자로부터 직접 데이터를 수집하는 ...