기본 콘텐츠로 건너뛰기

차등 정보보호 - 8. 임의화 응답과 프라이버시 손실의 관계 유도(스피너만 사용)

차등 정보보호 - 8. 임의화 응답과 프라이버시 손실의 관계 유도(스피너만 사용)

차등 정보보호(Differential Privacy)의 임의화 응답(Randomized Response) 기법에서 사용하는 스피너 모델은 사용자의 실제 답변을 확률적으로 바꾸어 프라이버시를 보호합니다. 스피너의 밝은 면이 차지하는 비율은 프라이버시 보호 수준, 즉 프라이버시 손실(Privacy Loss)과 직접적인 관계를 맺습니다.

스피너 모델의 작동 방식

먼저 스피너 모델이 어떻게 작동하는지 이해해야 합니다. 사용자가 “예” 또는 "아니오"로 답해야 하는 민감한 질문이 있다고 가정해 보겠습니다.

  1. 진실 응답: 사용자는 스피너를 돌리기 전에 질문에 대한 자신의 실제 답변(‘예’ 또는 ‘아니오’)을 마음속으로 정합니다.
  2. 스피너 돌리기:
    • 스피너가 밝은 면(p의 비율)에 멈추면, 사용자는 자신의 실제 답변을 그대로 말합니다.
    • 스피너가 어두운 면(1-p의 비율)에 멈추면, 사용자는 실제 답변의 반대 값을 말합니다.

정의를 임의화 응답에 적용하기

차등 정보보호의 일반적인 정의를 스피너를 사용하는 임의화 응답 모델에 적용해 보겠습니다.

  1. 알고리즘 M: 스피너를 돌려 답변을 결정하는 임의화 응답 절차입니다.
  2. 인접 데이터셋 D1,D2:
    • D1: 개인의 실제 답변이 '예(Yes)'인 경우
    • D2: 개인의 실제 답변이 '아니오(No)'인 경우
  3. 결과 O: 공격자가 관찰하는 것은 응답자가 최종적으로 보고한 답변입니다. 프라이버시가 가장 많이 유출되는 최악의 시나리오인 '예(Yes)'라고 응답한 경우를 가정합니다.

이제 차등 정보보호의 정의에 이 요소들을 대입합니다.

P(보고된 답변=실제 답변=)P(보고된 답변=실제 답변=아니)eϵ \frac{P\left(보고된\ 답변='예'\mid 실제\ 답변='예'\right)}{P\left(보고된\ 답변='예'\mid 실제\ 답변='아니오'\right)}\le e^{\epsilon }

프라이버시 손실은 특정 응답이 나왔을 때, 그 응답이 실제 '예’에서 나왔을 확률과 실제 '아니오’에서 나왔을 확률의 비율을 통해 측정됩니다. 이 비율에 자연로그를 취한 값이 프라이버시 손실(ε)입니다.

확률 계산 및 수식 연결

가장 프라이버시 손실이 큰 경우는, 즉 공격자가 가장 많은 정보를 얻을 수 있는 시나리오는 응답자가 '예’라고 답했을 때입니다. 이때의 프라이버시 손실을 계산해 보겠습니다.

응답이 '예’일 확률 계산:

  • 실제 답변이 '예’일 경우:
    • 밝은 면에 멈춰 '예’라고 답할 확률: p×1=p
    • 어두운 면에 멈춰 '예’라고 답할 확률: (1−p)×0=0
    • 따라서, P(보고된 답변='예’∣실제 답변=‘예’)=p
  • 실제 답변이 '아니오’일 경우:
    • 밝은 면에 멈춰 '예’라고 답할 확률: p×0=0
    • 어두운 면에 멈춰 '예’라고 답할 확률: (1−p)×1=1-p
    • 따라서, P(보고된 답변='예’∣실제 답변=‘아니오’)=1−p

이 확률들을 비율식에 넣으면 다음과 같습니다.

p1p \frac{p}{1-p}

이것이 차등 정보보호 정의의 eεe^ε보다 작거나 같아야 하므로,

p1peϵ \frac{p}{1-p}\le {e}^{\epsilon }

프라이버시 손실 ε을 구하기 위해 양변에 자연로그(ln)를 취하면, 임의화 응답에서의 프라이버시 손실 수식이 완성됩니다.

ln(p1p)ϵ \ln \left(\frac{p}{1-p}\right)\le \epsilon

따라서, 임의화 응답 메커니즘이 ε-차등 정보보호를 만족하기 위한 최소 ε 값, 즉 프라이버시 손실은

ln(p1p) \ln \left(\frac{p}{1-p}\right)

가 됩니다. 이 수식으로부터 특정 프라이버시 손실 수준을 지키기 위한 최대 p 값, 즉 진실을 말할 확률 계산식을 구할 수 있습니다.

p=eϵeϵ+1 p=\frac{e^{\epsilon }}{e^{\epsilon }+1}

이 과정을 통해 차등 정보보호라는 추상적인 수학적 정의가 어떻게 임의화 응답이라는 구체적인 알고리즘의 프라이버시 수준을 측정하는 수식으로 연결되는지 명확하게 알 수 있습니다.

Written with StackEdit.

댓글

이 블로그의 인기 게시물

Windows에 AMP와 MediaWiki 설치하기

1. 들어가기     AMP는 Apache + MySQL +  Perl/PHP/Python에 대한 줄임말이다. LAMP (Linux + AMP)라고 하여 Linux에 설치하는 것으로 많이 소개하고 있지만 Windows에서도 간편하게 설치하여 사용할 수 있다.       이 글은 Windows 7에 Apache + MySQL + PHP를 설치하고 그 기반에서 MediaWiki를 설치하여 실행하는 과정을 간략히 정리한 것이다. 2. MySQL     * 버전 5.6.12     1) 다운로드         http://dev.mysql.com/downloads/installer/         MySQL Installer 5.6.12         Windows (x86, 32-bit), MSI Installer         (mysql-installer-web-community-5.6.12.0.msi)     2) 다운로드한 MSI 파일을 더블클릭하여 설치를 진행한다.           설치 위치:                   C:\Program Files\MySQL               선택 사항:                       Install MySQL Products             Choosing a Se...

MATLAB Rutime 설치하기

MATLAB Rutime 설치하기 미설치시 에러 MATLAB Runtime 을 설치하지 않은 환경에서 MATLAB 응용프로그램이나 공유 라이브러리를 사용하려고 하면 아래와 같은 에러 메시지가 표시될 것입니다. 처리되지 않은 예외: System.TypeInitializationException: 'MathWorks.MATLAB.NET.Utility.MWMCR'의 형식 이니셜라이저에서 예 외를 Throw했습니다. ---> System.TypeInitializationException: 'MathWorks.MATLAB.NET.Arrays.MWArray'의 형식 이니셜라이저에서 예외를 Throw했습니다. ---> System.DllNotFoundException: DLL 'mclmcrrt9_3.dll'을(를) 로드할 수 없습니다. 지정된 모듈을 찾을 수 없습니다. (예외가 발생한 HRESULT: 0x8007007E) 위치: MathWorks.MATLAB.NET.Arrays.MWArray.mclmcrInitialize2(Int32 primaryMode) 위치: MathWorks.MATLAB.NET.Arrays.MWArray..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR.processExiting(Exception exception) 해결 방법 이 문제를 해결하기 위해서는 MATLAB Runtime 을 설치해야 합니다. 여러 가지 방법으로 MATLAB Runtime 을 설치할 수 있습니다. MATLAB 이 설치되어 있는 경우에는 MATLAB 설치 폴더 아래에 있는 MATLAB Runtime 설치 프로그램을 실행하여 설치합니다. ...

Wi-Fi 카드 2.4GHz로만 동작시키기

Wi-Fi 카드 2.4GHz로만 동작시키기 별도의 Wi-Fi AP 장치를 두지 않고 아래와 같은 기기들로만 Wi-Fi 네트워크를 구성하고자 할 때 주변 기기들이 2.4GHz만 지원하기 때문에 PC에서 실행하는 AP가 항상 2.4GHz를 사용하도록 Wi-Fi 카드를 설정해 주어야 합니다. 기기 Wi-Fi 카드 주파수 대역 Wi-Fi Direct 지원 PC (Windows 10) 2.4GHz, 5GHz O 주변 기기들 2.4GHz X Wi-Fi 카드별 주파수 대역 선택 방법 Windows 시작 메뉴에서 설정 을 클릭합니다. Windows 설정 화면에서 네트워크 및 인터넷 을 클릭합니다. 설정 화면의 왼쪽 메뉴바에서 Wi-Fi 를 클릭합니다. 화면 오른쪽 관련 설정 구역에 있는 어댑터 옵션 변경 을 클릭합니다. 설정을 바꾸고자 하는 Wi-Fi 카드 항목을 선택하고 마우스 오른쪽을 누른 다음 속성 메뉴를 클릭합니다. 대화상자의 네트워킹 탭 화면에 있는 구성 버튼을 클릭합니다. 장치 속성 대화상자의 고급 탭 화면으로 이동합니다. 제시되는 속성 항목들은 제품별로 다르며 자세한 사항은 아래의 제품별 설명을 참고하여 값을 설정하시기 바랍니다. Intel Dual Band Wireless-AC 7265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 선택합니다. Wireless Mode 1. 802.11a => 5GHz 4. 802.11b/g => 2.4GHz (이 항목 선택) 6. 802.11a/b/g => 2.4GHz, 5GHz Intel Dual Band Wireless-AC 8265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 ...