기본 콘텐츠로 건너뛰기

7월, 2025의 게시물 표시

차등 정보보호 - 9. 임의화 응답 원본 통계치 추정 공식 🎲(스피너+동전 사용)

임의화 응답은 개인의 민감한 정보에 '노이즈'를 추가하여 프라이버시를 보호하면서도 전체 통계의 유의미성을 확보하는 차등 정보보호 기술입니다. 이 페이지는 다중 선택 응답 환경에서 임의화 응답이 어떻게 동작하는지 시뮬레이션합니다. 각각의 선택 항목에 대하여 독립적으로 임의화 응답을 적용하는 것이므로 단일 선택 문제와 같은 기술을 사용한다고 보시면 됩니다. ​ 작동 원리 ⚙️: 정해진 프라이버시 손실(ε)에 따라 스피너의 밝은 면의 비율(p)을 아래와 같이 정합니다. $p=\frac{\combi{e}^{\varepsilon }-1}{\combi{e}^{\varepsilon }+1}$ p = e ϵ − 1 e ϵ + 1 ​ ​ 1단계 (응답자): 각 응답자는 스피너를 돌리기 전에 질문에 대한 자신의 실제 답변('예' 또는 '아니오')을 마음속으로 정합니다. 그리고 스피너를 돌립니다. 스피너가 밝은 면에 멈추면, 응답자는 자신의 실제 답변을 그대로 말합니다. 스피너가 어두운 면에 멈추면, 응답자는 동전을 던지는 것과 같이 50% 확률로 '예', 50% 확률로 '아니오' 중 하나를 무작위로 선택하여 답합니다. 2단계 (분석가): 분석가는 보고된 응답들을 수집합니다. 개별 응답은 진실인지 거짓인지 알 수 없지만, 전체 응답으로부터 원본 통계치를 추정할 수 있습니다. 3단계 (추정): 수집된 응답으로부터 원본 응답 비율(π true )을 추정하는 공식은 다음과 같습니다. 여기서 π noisy 는 노이즈가 포함된 응답에서 '예'라고 답한 비율, n은 총 응답자 수, p는 진실 응답 확률입니다. $\pi _{estimated}=\frac{\combi{\pi }_{noisy}-0.5\times \left(1-p\right)}{p}$ π e s t i m a t e d ​ = π n o i s y ​ − 0 . 5 × ( 1 − p ) p ​ ​ 위 공식으로 추정된 비율에 총 응답자 수 n...

Hugo로 생성한 정적 웹사이트를 GitHub Pages로 호스팅하기

Hugo로 생성한 정적 웹사이트를 GitHub Pages로 호스팅하기 Hugo 프레임워크에 DocDock 테마를 추가하여 정적 웹사이트를 만들고 이를 GitHub 저장소에 올려서 GitHub Pages 로 호스팅하는 과정을 정리하였습니다. 1. 제품 소개 Hugo 정적 웹사이트를 생성하는 도구. Go 언어로 개발됨. DocDock 기술 문서 작성을 위한 Hugo용 테마. Learn 테마를 기반으로 함. GitHub Pages 정적 웹사이트 호스팅 서비스를 무료로 제공. GitHub 저장소와 직접 연결. 개인, 조직, 프로젝트 유형에 따른 페이지 제공. 사이트 저장 용량은 최대 1GB. 2. Hugo와 DocDock 설치 다음과 같은 환경에서 설치를 진행하고 이 문서를 작성하였습니다. 프로세서: Intel Core i5 (x64 기반) 운영체제: Windows 10 (64 비트) 1) Hugo 설치 Hugo Releases 페이지에서 다음 파일을 다운로드하고 압축을 풉니다. 이 글을 작성하는 시점의 최신 출시는 0.56.0 버전입니다. hugo_x.x.x_Windows-64bit.zip 압축을 푼 폴더를 환경 변수 PATH 에 추가합니다. 2) 새 사이트 생성 사이트를 생성하고자 하는 폴더에서 명령 프롬프트 창을 엽니다. 다음과 같이 명령을 실행하여 새 Hugo 사이트를 생성합니다. C:\Temp>hugo new site quickstart Congratulations! Your new Hugo site is created in C:\Temp\quickstart. Just a few more steps and you're ready to go: 1. Download a theme into the same-named folder. Choose a theme from https://themes.gohugo.io/ or ...

차등 정보보호 - 10. 임의화 응답 원본 통계치 추정 공식 🎲 (스피너만 사용)

임의화 응답은 개인의 민감한 정보에 '노이즈'를 추가하여 프라이버시를 보호하면서도 전체 통계의 유의미성을 확보하는 차등 정보보호 기술입니다. 이 페이지는 민감한 질문(예: "마리화나를 핀 적이 있습니까?")에 대한 응답을 수집할 때 임의화 응답이 어떻게 동작하는지 시뮬레이션합니다. ​ 작동 원리 ⚙️: 정해진 프라이버시 손실(ε)에 따라 스피너의 밝은 면의 비율(p)을 아래와 같이 정합니다. $p=\frac{\combi{e}^{\varepsilon }}{\combi{e}^{\varepsilon }+1}$ p = e ϵ e ϵ + 1 ​ ​ 1단계 (응답자): 각 응답자는 스피너를 돌리기 전에 질문에 대한 자신의 실제 답변('예' 또는 '아니오')을 마음속으로 정합니다. 그리고 스피너를 돌립니다. 스피너가 밝은 면에 멈추면, 응답자는 자신의 실제 답변을 그대로 말합니다. 스피너가 어두운 면에 멈추면, 응답자는 거짓 답변을 말합니다. 2단계 (분석가): 분석가는 보고된 응답들을 수집합니다. 개별 응답은 진실인지 거짓인지 알 수 없지만, 전체 응답으로부터 원본 통계치를 추정할 수 있습니다. 3단계 (추정): 수집된 응답으로부터 원본 응답 비율(π true )을 추정하는 공식은 다음과 같습니다. 여기서 π noisy 는 노이즈가 포함된 응답에서 '예'라고 답한 비율, n은 총 응답자 수, p는 진실 응답 확률입니다. $\pi _{estimated}=\frac{\combi{\pi }_{noisy}-\left(1-p\right)}{2p-1}$ π e s t i m a t e d ​ = π n o i s y ​ − ( 1 − p ) 2 p − 1 ​ ​ 위 공식으로 추정된 비율에 총 응답자 수 n을 곱하면 원본 응답자 수를 추정할 수 있습니다. 응답자 수(n)가 적을 때는 추정 오차가 크지만, n이 커질수록 '추정된 실제 값' 이 '실제 값' 에 근접하는 것을 확인...