기본 콘텐츠로 건너뛰기

ZKPMATH-01. 행렬의 계수(rank), 그리고 계수가 1인 행렬의 특성

선형대수학에서 행렬의 계수(rank)는 행렬이 가진 정보의 '차원' 또는 '핵심 성분의 개수'를 알려주는 값으로, 데이터의 본질적인 복잡도를 파악하는 데 도움을 줍니다.

1. 행렬의 계수(Rank)란?

행렬의 계수는 간단히 말해, 그 행렬을 구성하는 행 또는 열 벡터들 중 서로 독립적인 벡터의 최대 개수를 의미합니다.

  • 열 계수(Column Rank): 행렬의 열 벡터들이 생성하는 벡터 공간(column space)의 차원. 즉, 선형적으로 독립인 열 벡터의 최대 개수입니다.
  • 행 계수(Row Rank): 행렬의 행 벡터들이 생성하는 벡터 공간(row space)의 차원. 즉, 선형적으로 독립인 행 벡터의 최대 개수입니다.

핵심 정리: 어떤 행렬이든 행 계수와 열 계수는 항상 같습니다. 그래서 우리는 이를 그냥 "행렬의 계수(rank)"라고 부릅니다.

2. 행렬의 계수 구하는 방법

행렬의 계수를 구하는 가장 일반적인 방법은 가우스 소거법(Gaussian Elimination)을 이용하여 행렬을 행 사다리꼴(Row Echelon Form)로 만드는 것입니다.

계산 순서:

  1. 주어진 행렬에 기본 행 연산(Elementary Row Operations)을 적용합니다.
    • 한 행에 0이 아닌 상수를 곱한다.
    • 두 행의 위치를 바꾼다.
    • 한 행에 상수를 곱하여 다른 행에 더한다.
  2. 행렬을 행 사다리꼴로 만듭니다. 행 사다리꼴은 다음 조건을 만족합니다.
    • 모든 성분이 0인 행은 맨 아래에 위치한다.
    • 0이 아닌 각 행에서, 왼쪽부터 보았을 때 처음으로 나타나는 0이 아닌 성분(이를 '리딩 엔트리' 또는 '피벗'이라 부릅니다)은 1이어야 한다.
    • 아래 행의 피벗은 항상 위 행의 피벗보다 오른쪽에 위치한다.
  3. 행 사다리꼴에서 0이 아닌 행의 개수를 셉니다. 이 개수가 바로 행렬의 계수입니다.

예시:

다음 행렬 A의 계수를 구해봅시다.

$$ A = \begin{pmatrix} 1 & 2 & 1 \\ -2 & -3 & 1 \\ 3 & 5 & 0 \end{pmatrix} $$

1행에 2를 곱하여 2행에 더합니다 (R2​←R2​+2R1​).

$$ \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 3 \\ 3 & 5 & 0 \end{pmatrix} $$

1행에 -3을 곱하여 3행에 더합니다 (R3​←R3​−3R1​).

$$ \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 3 \\ 0 & -1 & -3 \end{pmatrix} $$

2행을 3행에 더합니다 (R3​←R3​+R2​).

$$ \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 3 \\ 0 & 0 & 0 \end{pmatrix} $$

이제 행렬은 행 사다리꼴이 되었습니다. 0으로만 이루어진 행을 제외하면 0이 아닌 행은 2개입니다. 따라서, rank(A)=2 입니다.

3. 계수가 1인 행렬의 주요 특성

계수가 1인 행렬(rank(A)=1)은 매우 단순하고 예측 가능한 구조를 가집니다.

  • 모든 행이 서로 상수배 관계에 있습니다. 즉, 0이 아닌 어떤 특정 행 하나만 있으면 나머지 모든 행을 만들 수 있습니다.
  • 모든 열이 서로 상수배 관계에 있습니다. 0이 아닌 특정 열 하나만 있으면 나머지 모든 열을 만들 수 있습니다.
  • 두 벡터의 외적(Outer Product)으로 표현 가능합니다. 계수가 1인 m×n 행렬 A는 항상 0이 아닌 두 벡터 u (m×1)와 v (n×1)의 외적으로 표현할 수 있습니다. $$ A = \mathbf{u}\mathbf{v}^T $$ 이 내용은 아래 4번 항목에서 더 자세히 설명합니다.
  • 만약 행렬이 정방행렬(n×n,n>1)이라면, 행렬식(determinant)은 항상 0입니다. (det(A)=0)
  • 고윳값(eigenvalue) 중 하나를 제외한 모든 고윳값이 0입니다.

4. 계수가 1인 행렬과 두 벡터의 외적(Outer Product)

0이 아닌 두 벡터의 외적은 항상 계수가 1인 행렬을 생성하며, 반대로 모든 계수 1 행렬은 두 벡터의 외적으로 표현할 수 있습니다. 이 관계는 주성분 분석(PCA), 특이값 분해(SVD) 등 데이터 과학과 기계 학습의 여러 분야에서 매우 중요하게 활용됩니다.

계수가 1인 행렬을 두 벡터의 외적으로 표현할 수 있다는 사실은 단순히 수학적 표현을 넘어 여러 중요한 의미를 담고 있습니다. 왜 이것이 중요한지 세 가지 관점에서 설명해 보겠습니다.

1) 정보의 압축 (Information Compression)

가장 직관적인 의미는 정보의 효율성입니다.

  • 일반적으로 m×n 크기의 행렬은 총 m×n 개의 숫자를 저장해야 합니다. 예를 들어 100x100 행렬은 10,000개의 숫자가 필요하죠.
  • 하지만 만약 이 행렬의 계수가 1이라면, 우리는 이 행렬을 단 두 개의 벡터, 즉 m개의 성분을 가진 벡터 $\mathbf{u}$와 n개의 성분을 가진 벡터 $\mathbf{v}$로 완벽하게 표현할 수 있습니다. 필요한 숫자는 총 m+n 개뿐입니다.
  • 위의 100x100 행렬 예시에서, 계수가 1이라면 10,000개 대신 100 + 100 = 200개의 숫자만으로 모든 정보를 저장할 수 있습니다.

이는 엄청난 정보의 압축입니다. 행렬의 모든 행과 열에 존재하는 반복적인 패턴(모든 행이 한 벡터의 배수이고, 모든 열이 다른 한 벡터의 배수인)을 간결하게 표현하는 방법인 셈입니다.

2) 기하학적 변환의 단순성 (Geometric Simplicity)

행렬을 벡터에 곱하는 것은 '선형 변환'이라는 기하학적 의미를 가집니다. 계수가 1인 행렬은 이 변환이 매우 단순하다는 것을 의미합니다.

  • 어떤 벡터 $\mathbf{x}$를 계수가 1인 행렬 $A=\mathbf{u}\mathbf{v}^T$로 변환하면 다음과 같습니다. $$A\mathbf{x}=(\mathbf{u}\mathbf{v}^T)\mathbf{x}=\mathbf{u}(\mathbf{v}^T\mathbf{x})$$
  • 여기서 $\mathbf{v}^T\mathbf{x}$는 벡터 $\mathbf{v}$와 $\mathbf{x}$의 내적(inner product)이므로 결과는 하나의 숫자(스칼라)입니다. 이 스칼라 값을 $c$라고 해봅시다.
  • 결국 변환의 최종 결과는 $c\mathbf{u}$, 즉 벡터 $\mathbf{u}$의 스칼라 배가 됩니다.

이것이 의미하는 바는, m차원 공간에 있는 어떤 벡터 $\mathbf{x}$를 가져오더라도, 행렬 A는 그 벡터를 벡터 $\mathbf{u}$가 정의하는 하나의 직선 위로 떨어뜨린다(사영, projection)는 뜻입니다. 즉, m차원의 공간 전체를 단 하나의 1차원 직선으로 뭉개버리는 아주 단순한 변환인 것이죠.

3) 모든 행렬의 '기본 구성 요소' (Fundamental Building Block)

이것이 가장 중요하고 강력한 의미입니다. 계수가 1인 행렬은 모든 행렬을 구성하는 가장 기본적인 '벽돌' 또는 '원자'와 같습니다.

  • 놀랍게도, 세상의 모든 m×n 행렬 A는 계수가 1인 행렬들의 합으로 분해할 수 있습니다. 이를 특이값 분해(SVD, Singular Value Decomposition)라고 합니다. $$A=σ_1\mathbf{​u}_1​\mathbf{v}_1^T​+σ_2\mathbf{​u}_2\mathbf{​v}_2^T​+⋯+σ_r\mathbf{​u}_r\mathbf{​v}_r^T$$​ (r은 행렬 A의 계수입니다)
  • 위 식에서 각 항($σ_i​\mathbf{u}_i\mathbf{​v}_i^T$​)이 바로 계수가 1인 행렬입니다. $σ_i$​는 각 '벽돌'이 전체 행렬에 얼마나 중요한지를 나타내는 가중치(특이값)입니다.

이것은 마치 복잡한 그림을 몇 가지 기본 색상의 조합으로 표현하거나, 복잡한 음악을 몇 개의 기본 주파수의 합으로 표현하는 것과 같습니다. 데이터 과학에서는 이 원리를 이용해 데이터의 가장 중요한 패턴(가장 큰 σ값을 가지는 계수 1 행렬)만 추출하여 노이즈를 제거하거나 데이터를 압축(차원 축소)하는 데 널리 사용합니다. 이것이 바로 주성분 분석(PCA)의 핵심 아이디어이기도 합니다.

요약하자면, 계수가 1인 행렬이 두 벡터의 외적으로 표현된다는 것은 단순히 수식이 아니라, 그 행렬이 정보를 매우 효율적으로 담고 있으며, 기하학적으로 매우 단순한 변환을 수행하고, 더 나아가 모든 복잡한 행렬을 구성하는 기본 단위라는 깊은 의미를 내포하고 있습니다.

댓글

이 블로그의 인기 게시물

Windows에 AMP와 MediaWiki 설치하기

1. 들어가기     AMP는 Apache + MySQL +  Perl/PHP/Python에 대한 줄임말이다. LAMP (Linux + AMP)라고 하여 Linux에 설치하는 것으로 많이 소개하고 있지만 Windows에서도 간편하게 설치하여 사용할 수 있다.       이 글은 Windows 7에 Apache + MySQL + PHP를 설치하고 그 기반에서 MediaWiki를 설치하여 실행하는 과정을 간략히 정리한 것이다. 2. MySQL     * 버전 5.6.12     1) 다운로드         http://dev.mysql.com/downloads/installer/         MySQL Installer 5.6.12         Windows (x86, 32-bit), MSI Installer         (mysql-installer-web-community-5.6.12.0.msi)     2) 다운로드한 MSI 파일을 더블클릭하여 설치를 진행한다.           설치 위치:                   C:\Program Files\MySQL               선택 사항:                       Install MySQL Products             Choosing a Se...

MATLAB Rutime 설치하기

MATLAB Rutime 설치하기 미설치시 에러 MATLAB Runtime 을 설치하지 않은 환경에서 MATLAB 응용프로그램이나 공유 라이브러리를 사용하려고 하면 아래와 같은 에러 메시지가 표시될 것입니다. 처리되지 않은 예외: System.TypeInitializationException: 'MathWorks.MATLAB.NET.Utility.MWMCR'의 형식 이니셜라이저에서 예 외를 Throw했습니다. ---> System.TypeInitializationException: 'MathWorks.MATLAB.NET.Arrays.MWArray'의 형식 이니셜라이저에서 예외를 Throw했습니다. ---> System.DllNotFoundException: DLL 'mclmcrrt9_3.dll'을(를) 로드할 수 없습니다. 지정된 모듈을 찾을 수 없습니다. (예외가 발생한 HRESULT: 0x8007007E) 위치: MathWorks.MATLAB.NET.Arrays.MWArray.mclmcrInitialize2(Int32 primaryMode) 위치: MathWorks.MATLAB.NET.Arrays.MWArray..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR..cctor() --- 내부 예외 스택 추적의 끝 --- 위치: MathWorks.MATLAB.NET.Utility.MWMCR.processExiting(Exception exception) 해결 방법 이 문제를 해결하기 위해서는 MATLAB Runtime 을 설치해야 합니다. 여러 가지 방법으로 MATLAB Runtime 을 설치할 수 있습니다. MATLAB 이 설치되어 있는 경우에는 MATLAB 설치 폴더 아래에 있는 MATLAB Runtime 설치 프로그램을 실행하여 설치합니다. ...

Wi-Fi 카드 2.4GHz로만 동작시키기

Wi-Fi 카드 2.4GHz로만 동작시키기 별도의 Wi-Fi AP 장치를 두지 않고 아래와 같은 기기들로만 Wi-Fi 네트워크를 구성하고자 할 때 주변 기기들이 2.4GHz만 지원하기 때문에 PC에서 실행하는 AP가 항상 2.4GHz를 사용하도록 Wi-Fi 카드를 설정해 주어야 합니다. 기기 Wi-Fi 카드 주파수 대역 Wi-Fi Direct 지원 PC (Windows 10) 2.4GHz, 5GHz O 주변 기기들 2.4GHz X Wi-Fi 카드별 주파수 대역 선택 방법 Windows 시작 메뉴에서 설정 을 클릭합니다. Windows 설정 화면에서 네트워크 및 인터넷 을 클릭합니다. 설정 화면의 왼쪽 메뉴바에서 Wi-Fi 를 클릭합니다. 화면 오른쪽 관련 설정 구역에 있는 어댑터 옵션 변경 을 클릭합니다. 설정을 바꾸고자 하는 Wi-Fi 카드 항목을 선택하고 마우스 오른쪽을 누른 다음 속성 메뉴를 클릭합니다. 대화상자의 네트워킹 탭 화면에 있는 구성 버튼을 클릭합니다. 장치 속성 대화상자의 고급 탭 화면으로 이동합니다. 제시되는 속성 항목들은 제품별로 다르며 자세한 사항은 아래의 제품별 설명을 참고하여 값을 설정하시기 바랍니다. Intel Dual Band Wireless-AC 7265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 선택합니다. Wireless Mode 1. 802.11a => 5GHz 4. 802.11b/g => 2.4GHz (이 항목 선택) 6. 802.11a/b/g => 2.4GHz, 5GHz Intel Dual Band Wireless-AC 8265 기술 사양 주파수 대역: 2.4GHz, 5GHz 무선 표준: 802.11ac 주파수 대역 선택 장치 속성 대화상자에서 아래와 같이 ...