[탐구 보고서] 주축정리로 기하의 이차곡선 심화하기

[탐구 보고서] 주축정리로 기하의 이차곡선 심화하기

고등학교 ‘기하’의 이차곡선 심화하기

목차

도입

Screenshot from 2024-08-03 17-43-00

이 함수를 이해하고 그릴 수 있다면 이 포스팅을 읽을 필요가 없다.

하지만 고교 과정까지 수료한 사람은 이 함수를 이해할 수 없다.

이번 포스팅에선 선형대수학주축정리를 이해해 해당 수식을 파헤쳐보는 시간을 가질 것이다.

배경지식

행렬의 연산과 용어들에 대한 설명을 하면 너무 길어질 듯 하니 영상으로 대체하겠다.

주축정리든 이차형식이든 선형대수학의 정리들을 진행하기 위해서는 선형대수학의 기본 정리를 아는 것이 우선이라 생각한다.

선형 사상

임의의 벡터공간 V에서 W로 가는 함수를 사상이라 하는데, 이게 선형 사상이 되기 위해선 다음 2가지 조건을 충족해야 한다.

\[벡터 \,공간 \,V의 \,임의의 \,원소 \,v에 \,대해\\ f(v1 + v2) = f(v1) + f(v2)\\ f(cv) = cf(v)\]

한 공간의 기저 벡터를 이러한 선형 사상에 대입한 것을 그림으로 이해하면 다음과 같다.

Screenshot from 2024-08-03 18-19-05

이렇게 변화한 공간에는 2가지 특징이 있다.

\[원점의\, 위치는\, 일정하다.\\ 공간에\, 격자선을\, 그을때\, 선끼리\, 평행하고,\, 구부러짐이\, 없다.\]

이 특징은 위의 선형 사상의 정의와 동치이다.

자세한 내용 및 그림은 해당 영상 참고

선형대수학의 기본 정리

선형대수학을 공부하다 보면 선형 사상은 거의 사용하지 않고, 행렬을 이용하는 모습을 볼 수 있다.

위의 내용에 따르면 선형 사상을 이용해야 할 것 같은데 왜 행렬을 사용하는 것일까? 그 이유가 선형대수학의 기본 정리에 있다.

\[V: dim V = n, \,B = \left\{v_1, v_2, ..., v_n\right\} \\ W: dim W = m, \,C = \left\{w_1, w_2, ..., w_n\right\}\]

이렇게 두 벡터 공간과 기저를 정의했을때

V에서 W로 향하는 선형 사상 전체의 집합 L(V, W)에 대해서, 이 집합의 원소(즉, 선형사상) L에 대해 다음과 같은 함숫값들을 생각해보자.

\[L \in L(V, W)\\ \Downarrow\\ \begin{cases} L(v_1) = a_{11}w_1 + a_{21}w_2 + \cdots + a_{m1}w_m \\ L(v_2) = a_{12}w_1 + a_{22}w_2 + \cdots + a_{m2}w_m \\ \vdots \\ L(v_n) = a_{1n}w_1 + a_{2n}w_2 + \cdots + a_{mn}w_m \end{cases}\\ \Downarrow\\ L(v_j) = \sum_{i=1}^m a_{ij}w_i\]

즉, V의 기저 B의 원소들을 L에 대입한 함숫값은 W의 벡터로 나타내어 지는데, 이 W의 벡터들을 W의 기저 C의 일차결합으로 모두 나타낸 것이다.

그러면, B의 벡터 하나당 일차결합 상수가 위와 같이 m개씩 나오게 된다.

왜냐하면 W의 차원이 m이므로 m개의 기저 벡터들로 나타낼 수 있기 때문이고, 이들을 V의 기저에 속한 n개의 벡터 모두에 대해서 정리하여, 위와 같이 총 m*n개의 상수들을 찾을 수 있다.

이 m*n개의 상수를 행렬로 나타낼 수 있다. 이를 선형대수학 책들에선 다음과 같이 표현한다.

\[\left[L\right]_C^B = \left(a_{ij}\right)_{m \times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\]

이를 L(V, W)의 선형 사상 L에 대해서, 선형 기저 B, C에 관한 L의 행렬표현이라고 한다.

이제 선형대수학의 기본 정리를 알아보자.

\[1.\ \Phi_C^B: \text{M}_{m \times n}(F) \rightarrow \text{L}(V, W) \\ \text{s.t.} \ \left(\Phi_C^B(A)\right)(v) = A\left[v\right]_B \quad \\ (A \in \text{M}_{m \times n}(F),\ v \in V)\] \[2.\ \Psi_C^B: \text{L}(V, W) \rightarrow \text{M}_{m \times n}(F) \\ \text{s.t.} \ \Psi_C^B(L) = \left[L\right]_C^B \quad \\(L \in \text{L}(V, W))\]

이를 말로 풀어 쓰면 다음과 같다.

  1. Φ와 Ψ는 모두 동형사상이다.
  2. Φ와 Ψ는 서로 역사상 관계이다.

이것을 더 풀어서 얘기하면 다음과 같은 중요한 내용이 된다.

선형사상과 행렬은 동치이다. 즉, 서로의 정리들을 적용할 수 있고, 모든 선형사상을 행렬로 대응할 수 있다.

그래서 선형사상을 행렬로 나타냈던 것이다. 1법칙과 2법칙의 증명은 다른 포스팅 참고 너무 길어서 뺐음

기타

주축정리를 이해할때 고윳값행렬의 대각화에 대한 지식이 필요한데, 이 내용들은 계산에 대한 내용이지, 위처럼 구체적인 이해를 요구하지 않으므로 생략하겠다.

이차곡선의 심화분석

$ Ax^2 + Bxy + Cy^2 + Dx + Ey + F $

고교과정 기하에서는 이 수식의 제한된 형태를 학습했다.

이제, 좀 더 심화적인 분석 과정을 예시와 함께 밟아보자.

$ 2x^2 + 2xy + 2y^2 = 1$ 에 대해 이를 $f(\vec{x}) = \vec{x}^TA\vec{x}$ 형태로 나타내면 다음과 같다. (단, $\vec{x} = \left(x, y \right)$)

\[\vec{x}^T\begin{pmatrix} 2 & 1\\ 1& 2\\ \end{pmatrix} \vec{x} = 1\]

1(참고로 $ Ax^2+Bxy+Cy^2 $ 으로 나타내지는 식을 이차형식이라고 한다)

이때 \(\vec{x}^TA\vec{x}\) 의 값은 실수이므로, \(\vec{x}^TA\vec{x} = (\vec{x}^TA\vec{x})^T\) 이므로

\(B = \frac{1}{2}(A + A^T), \,C = \frac{1}{2}(A - A^T)\) 라 할때 다음이 성립한다.

\[q(\vec{x}) = \vec{x}^T A \vec{x} = \vec{x}^T (B + C) \vec{x} = \vec{x}^T B \vec{x} + \vec{x}^T C \vec{x} = \vec{x}^T B \vec{x}\] \[(\because x^T C x = (x^T C x)^T = x^T C^T x = -x^T C x = 0)\]

즉, A를 항상 대칭행렬인 것으로 보아도 상관없고, 항상 직교 대각화가 가능하다. (B가 대칭행렬)

그래서 위의 식을 직교 대각화 하면

\[\mathbf{x}^T A \mathbf{x} = \mathbf{x}^T Q D Q^{-1} \mathbf{x} = \begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}\] \[\begin{pmatrix} \frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y & -\frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \\ -\frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \end{pmatrix}\]

이다.

이때 \(\begin{pmatrix} \frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \\ -\frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \end{pmatrix}\) 은 선형 변환한 결과이므로 새로운 좌표 축 $(x’, y’) $ 으로 나타낼 수 있다.

\[\begin{pmatrix} x' & y' \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} x' \\ y' \end{pmatrix} = 3x'^2 + 1y'^2\] \[\frac{x'^2}{\left(\frac{1}{\sqrt{3}}\right)^2} + \frac{y'^2}{1^2}\]

즉, $ 2x^2 + 2xy + 2y^2 = 1 $ 은 타원을 \(\begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}\) 만큼 회전시킨 것이었다.

이제, 이 수식들의 의미를 알아보자.

주축정리

이 정리는 어떤 이차형식이든 적절한 변수변환을 통해 혼합항(대각성분을 제외한 항들)을 없앨 수 있다는 것이다.

\[X^{T} A X = Y^{T} D Y\]

이 과정은 \(\begin{pmatrix} \frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \\ -\frac{1}{\sqrt{2}} x + \frac{1}{\sqrt{2}} y \end{pmatrix} = (x', y')\) 의 과정과 정확히 일치한다!

이때 정리가 말하길, \(\begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}\) 에서 각 열벡터는 \(\begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix} \,\) 의 고유벡터와 같고 (고윳값의 크기순)

\(\begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \,\) 변수변환으로 대각성분만 남은 행렬의 대각성분은 \(\begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix}\,\) 의 고윳값과 같다고 한다.

해당 정리를 응용하면 다음과 같은 식도 정리할 수 있다.

\[f(x, y) = f(\vec{x}) = ax^2 + by^2 + cxy + dx + ey + g = \vec{x^T}A\vec{x} + \vec{b^T}\vec{x} + g\]

여기서 아래처럼 변수 변환을 하면 x, y항이 사라지고,

\[\vec{x} \rightarrow \vec{x'} = \vec{x} - \frac{1}{2}A^{-1}\vec{b}\]

마지막 상수항 $g$는 평행이동을 통해 일반적인 이차식을 이차형식으로 만들 수 있다.

즉, 이렇게 임의의 이차식을 이차형식으로 변환 후, 위의 과정을 거치면 모든 이차식을 분석하고 그릴 수 있다!

느낀점

이차곡선에서 특정 이차식을 표현하지 못하는데에 한계를 느끼고, 인공지능과 데이터 분석 분야에서 선형대수학이 널리 쓰인다는 것을 깨달아 선형대수학 학습에 필요성을 느껴 다음과 같은 탐구과정을 진행함.

선형대수학의 전반적인 내용을 학습하면서, 계산뿐만 아니라 수식들의 직관적이고 기하적인 이해를 목표로 삼음. 특히, 선형대수학의 기본 정리를 학습하며, 그 정리의 바탕인 수학의 대수구조를 통해 고등학교 수학과 대학교 수학의 큰 차이점을 깨달았을 뿐 아니라, 이후 차원 정리, 주축 정리와 같은 중요한 정리들을 이해하는 기초가 됨.

주축정리를 이해하며 행렬의 고윳값과 고유 벡터의 용도를 깊이 있게 알 수 있었을 뿐 아니라, 고교과정 중 하나인 이차곡선 단원으로는 알 수 없는 이차곡선의 회전 정도, 그릴 수 없는 이차곡선도 잘 그릴 수 있게 됨. 이를 통해 모든 이차식을 분석할 수 있다는 점에 크게 만족함.

이런 탐구과정을 통해 기하라는 교과목에 대한 이해도를 높일 수 있었을 뿐 아니라, 인공지능 분야에 쓰이는 많은 수식들을 이해할 수 있었음. 대표적인 예로 인공신경망에서 각 유닛 간의 계산이 바로 행렬 곱셈이라는 것을 깨달았다는 것이 있음. 추후 인공지능 수학을 학습할때 이번 경험이 큰 도움이 될 것 같다는 점을 느낌.

이상.

MovingJu
MovingJu Artificial Intelligence student.
comments powered by Disqus