기본 콘텐츠로 건너뛰기

차등 정보보호 - 1. 재식별 위험: 보이지 않는 위협

데이터의 가치와 공개의 역설

데이터를 완벽하게 보호하는 가장 확실한 방법은 아무에게도 공개하지 않는 것입니다. 하지만 이는 데이터가 가진 무한한 잠재력을 사장시키는 것과 같습니다. 결국 데이터의 가치를 실현하기 위해 '공개'는 피할 수 없는 선택이며, 바로 그 순간 '재식별'이라는 피할 수 없는 위험이 뒤따릅니다.

이름이나 주민등록번호 같은 명백한 식별자를 제거하는 것만으로는 충분하지 않습니다. 언뜻 사소해 보이는 여러 정보가 조각 그림 맞추듯 결합되면, 결국 특정 개인을 가리키는 '재식별'의 화살이 될 수 있기 때문입니다. 이 위험이 얼마나 현실적인지, 구체적인 시나리오를 통해 살펴보겠습니다.

평범한 통계에 숨겨진 위험

어느 작은 마을에 1,000명이 살고 있습니다. 보건 당국이 이 마을의 희귀 질병 유병률을 조사해 '전체 주민의 1%가 환자'라는 통계를 발표했습니다. 1년 후, 10명의 새로운 이주민이 생긴 상태에서 다시 조사하니 유병률은 1.09%로 약간 올랐습니다. 여기까지는 지극히 평범한 공중 보건 데이터처럼 보입니다.

하지만 여기에 '지난 1년간 이사 온 사람은 10명뿐'이라는 인구 이동 데이터가 더해진다면 어떨까요? 순식간에 익명의 통계는 한 개인을 겨냥하는 날카로운 정보가 됩니다.

  • 작년 환자 수: 1,000명 × 1% = 10명

  • 올해 환자 수: (1,000명 + 10명) × 1.09% ≈ 11명

이 간단한 계산은 한 가지 사실을 암시합니다. 새로 늘어난 환자 1명은 새로 이사 온 10명 중 한 명일 가능성이 매우 높다는 것을 말입니다.

이처럼 개인을 직접 식별할 수 있는 정보가 전혀 없어도, 여러 데이터가 결합될 때 어떻게 특정인의 민감한 정보가 노출될 수 있는지를 명확히 보여줍니다. 이것이 바로 '재식별 공격'의 현실입니다.

 차등 정보보호 - 1. 재식별 위험: 보이지 않는 위협

데이터를 완벽하게 보호하는 가장 확실한 방법은 공개하지 않는 것입니다. 하지만 이는 데이터가 가진 무한한 활용 가치를 포기하는 것과 같습니다. 결국 데이터의 가치를 실현하기 위해 공개는 불가피하며, 바로 그 순간 '재식별’이라는 그림자가 따라붙습니다. 설령 이름이나 주민등록번호 같은 직접적인 식별자를 제거하더라도, 다른 정보와 결합하면 특정 개인을 추론해낼 수 있는 위험은 사라지지 않습니다. 이는 정도의 차이만 있을 뿐, 근본적으로 피하기 어려운 문제입니다.

재식별 위험이 어떻게 현실화될 수 있는지 구체적인 예를 통해 살펴보겠습니다.

어떤 지역 주민 전체를 대상으로 특정 질병의 보유 현황을 조사했다고 가정해 봅시다. 조사 기관은 첫해에 주민의 1%가 해당 질병을 앓고 있다는 통계를 발표했습니다. 그리고 1년 후 같은 조사를 반복하니, 그 비율이 1.09%로 소폭 증가했다는 사실을 공개했습니다.

여기까지만 보면 아무 문제가 없어 보입니다. 하지만 만약 누군가 이 지역의 1년간 인구 이동 자료에 접근할 수 있다면 어떨까요?

그는 작년 총인구가 1,000명이었고, 그사이 이사 나간 사람은 없이 10명만 새로 전입했다는 사실을 알게 됩니다. 이 정보를 질병 통계와 결합하면, 매우 구체적인 추론이 가능해집니다.

계산 과정:

  • 작년 환자 수: 1,000명의 1% = 10명
  • 올해 환자 수: 1,010명의 1.09% ≈ 11명
  • 결론: 인구 변동이 오직 신규 전입자 10명뿐이었으므로, 이들 중 1명이 질병 보유자일 가능성이 매우 높습니다. (물론 설문조사에서 누군가 거짓 답변을 했을 수도 있기에 '추정’이라고 표현합니다.)

이러한 상황을 인지하게 된 신규 전입자 10명의 심정은 어떨까요? 특히 실제 질병을 보유한 사람은 자신이 10%의 확률로 특정될 수 있다는 사실만으로도 극심한 불안감을 느낄 수 있습니다.

이처럼 안전해 보이는 비식별 통계 데이터조차 다른 정보와 만났을 때 어떻게 개인의 프라이버시를 위협할 수 있는지 명확히 보여주는 사례입니다.

Written with StackEdit.

댓글

이 블로그의 인기 게시물

Windows에 AMP와 MediaWiki 설치하기

1. 들어가기     AMP는 Apache + MySQL +  Perl/PHP/Python에 대한 줄임말이다. LAMP (Linux + AMP)라고 하여 Linux에 설치하는 것으로 많이 소개하고 있지만 Windows에서도 간편하게 설치하여 사용할 수 있다.       이 글은 Windows 7에 Apache + MySQL + PHP를 설치하고 그 기반에서 MediaWiki를 설치하여 실행하는 과정을 간략히 정리한 것이다. 2. MySQL     * 버전 5.6.12     1) 다운로드         http://dev.mysql.com/downloads/installer/         MySQL Installer 5.6.12         Windows (x86, 32-bit), MSI Installer         (mysql-installer-web-community-5.6.12.0.msi)     2) 다운로드한 MSI 파일을 더블클릭하여 설치를 진행한다.           설치 위치:                   C:\Program Files\MySQL               선택 사항:                       Install MySQL Products             Choosing a Se...

MATLAB Rutime 설치하기

MATLAB Rutime 설치하기 미설치시 에러 MATLAB Runtime 을 설치하지 않은 환경에서 MATLAB 응용프로그램이나 공유 라이브러리를 사용하려고 하면 아래와 같은 에러 메시지가 표시될 것입니다. 처리되지 않은 예외: System.TypeInitializationException: 'MathWorks.MATLAB.NET.Utility.MWMCR'의 형식 이니셜라이저에서 예 외를 Throw했습니다. ---> System.TypeInitializationException: 'MathWorks.MATLAB.NET.Arrays.MWArray'의 형식 이니셜라이저에서 예외를 Throw했습니다. ---> System.DllNotFoundException: DLL 'mclmcrrt9_3.dll'을(를) 로드할 수 없습니다. 지정된 모듈을 찾을 수 없습니다. (예외가 발생한 HRESULT: 0x8007007E) 위치: MathWorks.MATLAB.NET.Arrays.MWArray.mclmcrInitialize2(Int32 primaryMode) 위치: MathWorks.MATLAB.NET.Arrays.MWArray..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR.processExiting(Exception exception) 해결 방법 이 문제를 해결하기 위해서는 MATLAB Runtime 을 설치해야 합니다. 여러 가지 방법으로 MATLAB Runtime 을 설치할 수 있습니다. MATLAB 이 설치되어 있는 경우에는 MATLAB 설치 폴더 아래에 있는 MATLAB Runtime 설치 프로그램을 실행하여 설치합니다. ...

Wi-Fi 카드 2.4GHz로만 동작시키기

Wi-Fi 카드 2.4GHz로만 동작시키기 별도의 Wi-Fi AP 장치를 두지 않고 아래와 같은 기기들로만 Wi-Fi 네트워크를 구성하고자 할 때 주변 기기들이 2.4GHz만 지원하기 때문에 PC에서 실행하는 AP가 항상 2.4GHz를 사용하도록 Wi-Fi 카드를 설정해 주어야 합니다. 기기 Wi-Fi 카드 주파수 대역 Wi-Fi Direct 지원 PC (Windows 10) 2.4GHz, 5GHz O 주변 기기들 2.4GHz X Wi-Fi 카드별 주파수 대역 선택 방법 Windows 시작 메뉴에서 설정 을 클릭합니다. Windows 설정 화면에서 네트워크 및 인터넷 을 클릭합니다. 설정 화면의 왼쪽 메뉴바에서 Wi-Fi 를 클릭합니다. 화면 오른쪽 관련 설정 구역에 있는 어댑터 옵션 변경 을 클릭합니다. 설정을 바꾸고자 하는 Wi-Fi 카드 항목을 선택하고 마우스 오른쪽을 누른 다음 속성 메뉴를 클릭합니다. 대화상자의 네트워킹 탭 화면에 있는 구성 버튼을 클릭합니다. 장치 속성 대화상자의 고급 탭 화면으로 이동합니다. 제시되는 속성 항목들은 제품별로 다르며 자세한 사항은 아래의 제품별 설명을 참고하여 값을 설정하시기 바랍니다. Intel Dual Band Wireless-AC 7265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 선택합니다. Wireless Mode 1. 802.11a => 5GHz 4. 802.11b/g => 2.4GHz (이 항목 선택) 6. 802.11a/b/g => 2.4GHz, 5GHz Intel Dual Band Wireless-AC 8265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 ...