UNIVERSE

행렬의 다양한 연산

수학/선형대수
작성일:

이번 시간에는 선형연립방정식의 풀이법을 위한 행렬이 아닌 행렬 그 자체의 본질에 대해 알아볼 것입니다. 행렬은 본래 단순한 선형연립방정식의 계수들의 배열에 불과했으나 프랑스의 수학자 자크 비네(Jacques Binet)가 이 단순한 배열에 새로운 특성을 정의했습니다. 그런 특성은 행렬을 아주 유용한 도구로 만들어주었고 행렬 그 자체로 여러 연산을 할 수 있게 되었습니다.

 

우리는 이전시간에 가우스소거법을 위해 아래와 같은 행렬표현을 사용했습니다.

 

\(\left[\begin{array}{ccccc|c} a_{11} & a_{12} & a_{13} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn} & b_m \end{array}\right]\)

 

이 표현법은 중요하지만 좀 더 일반적인 표현법이라고 한다면 바로 이런 것이 될 것입니다.

 

$$\begin{bmatrix} \ a_{11} & a_{12} & a_{13} & \cdots & a_{1n} \\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = \begin{bmatrix} b_1\\b_2\\\vdots\\b_n\end{bmatrix}$$

 

위 식은 분명히 선형연립방정식의 일반화된 표현에서 나온 것 같은데, 어떻게 저렇게 표현이 될 수 있는지는 아래의 행렬에 대한 곱셈에서 설명해드리겠습니다. 그 전에 먼저 차근차근 행렬의 기본부터 알아봅시다.

 

행렬의 정의

\begin{bmatrix} \ a_{11} & a_{12} & a_{13} & \cdots & a_{1n} \\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn} \end{bmatrix}

 

위와 같은 행렬은 \(m\)행 \(n\)열으로, \(A_{m\times n\)으로 표현하게 됩니다. \(m by n\)행렬이라고 읽습니다. 특별히 행과 열의 크기가 같은 \(m\times m\)행렬의 경우 \(m\)차 정사각행렬 또는 정방행렬이라고 합니다.

 

참고로 행렬의 행이나 열의 크기가 \(1\)인 한쪽으로 긴 행렬을 나중에는 벡터로 취급하게 됩니다.

 

행렬의 상등

크기가 \(m\times n\)으로 서로 같은 행렬 \(A, B\)에 대해 각각의 성분 \(a_{ij}\)와 \(b_{ij}\)가 모든 \(i, j\)에서 \(a_{ij}=b_{ij}\)라면 그 두 행렬 \(A, B\)는 서로 같다라고 하고 \(A=B\)라고 표현할 수 있습니다.

 

간단히 말해서 \(\begin{vmatrix}a & b \\ c & d\end{vmatrix} = \begin{vmatrix}2 & -1 \\ 1 & 0\end{vmatrix}\)이면 \(a=2, b = -1, c = 1, d = 0\)입니다.

 

행렬의 덧셈과 뺄셈

행의 개수와 열의 개수가 서로 같은 행렬 \(A_{m\times n}, B_{m\times n}\)에 대해 다음과 같은 덧셈 연산이 가능합니다.

 

$$\begin{array}{} A+B&=& \begin{bmatrix} \ a_{11} & a_{12} & a_{13} & \cdots & a_{1n} \\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn} \end{bmatrix} + \begin{bmatrix} \ b_{11} & b_{12} & b_{13} & \cdots & b_{1n} \\ b_{21} & b_{22} & b_{23} & \cdots & b_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ b_{m1} & b_{m2} & b_{m3} & \cdots & b_{mn} \end{bmatrix}\\ &=& \begin{bmatrix} \ a_{11} + b_{11} & a_{12} + b_{12} & a_{13} + b_{13} & \cdots & a_{1n} + b_{1n} \\ a_{21} + b_{21} & a_{22} + b_{22} & a_{23} + b_{23} & \cdots & a_{2n} + b_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{m1} + b_{m1} & a_{m2} + b_{m2} & a_{m3} + b_{m3} & \cdots & a_{mn} + b_{mn} \end{bmatrix}\end{array}$$

 

실수체계의 덧셈연산과 다르지 않으므로 아래와 같이 교환법칙, 분배법칙이 성립하고 덧셈에 대한 항등원과 역원도 존재합니다.

\(A+B = B+A\)

\((A+B)+C = A+(B+C)\)

\(A+O = A\)

\(A+(-A) = O\)

 

덧셈에 대한 항등원 \(O\)는 모든 성분이 \(0\)인 \(m\times n\)크기의 영행렬을 말합니다.

 

행렬의 실수배

행렬 \(A_{m\times n}\)와 임의의 실수 \(k\in\mathbb{R}\)를 곱하면 행렬 \(A_{m\times n}\)의 모든 성분에 \(k\)배가 된 다음과 같은 행렬을 얻을 수 있습니다.

 

$$kA = \begin{bmatrix} \ ka_{11} & ka_{12} & ka_{13} & \cdots & ka_{1n} \\ ka_{21} & ka_{22} & ka_{23} & \cdots & ka_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ ka_{m1} & ka_{m2} & ka_{m3} & \cdots & ka_{mn} \end{bmatrix}$$

 

행렬의 실수배는 행렬\(A_{m\times n}, B_{m\times n}\)와 임의의 실수 \(k, l\in\mathbb{R}\)에 대해 다음과 같은 성질이 있습니다.

\(k(A+B) = kA + kB\)

\((k+l)A = kA + lA\)

\((kl)A = k(lA)\)

\(1A = A\)

 

행렬의 곱셈

행렬간의 곱셈은 함수의 합성으로 정의되어 있기 때문에 곱하는 행렬간에 크기가 맞지 않으면 곱셈이 불가능한 경우가 있고 그에 따라 여러 곱셈법칙 또한 성립하지 않기 때문에 실수체계에서의 곱셈과는 달라 상당히 낯설게 느껴질 수 있습니다.

 

행렬 \(A_{m\times l}, B_{l\times n}\)에 대해 다음과 같은 곱셈이 성립합니다.

 

$$AB = \begin{bmatrix} \ a_{11} & a_{12}  & \cdots & a_{1l} \\ a_{21} & a_{22}  & \cdots & a_{2l} \\ \vdots & \vdots  & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{ml} \end{bmatrix} \begin{bmatrix} \ b_{11} & b_{12}  & \cdots & b_{1n} \\ b_{21} & b_{22}  & \cdots & b_{2n} \\ \vdots & \vdots  & \ddots & \vdots \\ b_{l1} & b_{l2} & \cdots & b_{ln} \end{bmatrix} = \begin{bmatrix} \ c_{11} & c_{12}  & \cdots & c_{1n} \\ c_{21} & c_{22}  & \cdots & c_{2n} \\ \vdots & \vdots  & \ddots & \vdots \\ c_{m1} & c_{m2} & \cdots & c_{mn} \end{bmatrix}$$

 

여기서 행렬 \(C=AB\)의 성분 \(c_{ij}\)는 아래와 같이 정의됩니다.

$$c_{ij} = \sum_{k=1}^{l} a_{ik}b_{kj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{il}b_{lj}$$

 

위의 식에서 알 수 있듯이 행렬간의 곱셈이 성립하기 위해서는 두 행렬의 곱 \(AB\)에서 \(A\) 열과 \(B\) 행의 크기가 같아야 합니다. 다시 말하면 행렬곱 \(A_{m\times l}B_{l\times n}\)는 행렬 \(A\)의 열의 크기 \(l\)와 행렬 \(B\)의 행의 크기 \(l\)가 서로 같기 때문에 곱셈이 가능하고 그 행렬곱의 결과는 \(m\times n\)가 됩니다.

 

$$\begin{bmatrix} \ a_{11} & a_{12} & a_{13} & \cdots & a_{1n} \\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_m \end{bmatrix} = \begin{bmatrix} b_1\\b_2\\\vdots\\b_m\end{bmatrix}$$

 

이해를 돕기 위해 글 초반부에 썼던 행렬 표현을 다시 한번 봅시다. 위의 행렬은 \(Ax = b\)의 꼴이라고 하겠습니다. \(A_{m\times n}\)와 \(x_{m\times 1}\)를 곱했을 때 결과가 \(b_{m\times 1}\)가 됨을 알 수 있고 또한 이것은 행렬의 상등에 의해 선형연립방정식과 동일하다는 것을 알 수 있습니다.

 

\(\begin{bmatrix} \ a_{11}x_1 + a_{12}x_2 + a_{13}x_3 + \cdots + a_{1n}x_m \\ a_{21}x_1 + a_{22}x_2 + a_{23}x_3 + \cdots +a_{2n}x_m \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + a_{m3}x_3 + \cdots + a_{mn}x_m \end{bmatrix} =  \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_m\end{bmatrix}\)\(\Leftrightarrow \begin{cases}a_{11}x_1 + a_{12}x_2 + a_{13}x_3 + \cdots + a_{1n}x_m = b_1\\a_{21}x_1 + a_{22}x_2 + a_{23}x_3 + \cdots + a_{2n}x_m = b_2\\\qquad\qquad\qquad\qquad\vdots\\a_{m1}x_1 + a_{m2}x_2 + a_{m3}x_3 + \cdots + a_{mn}x_m = b_m\end{cases}\)

 

행렬간 곱셈은 서로 곱셈이 가능한 행렬 \(A, B, C\)와 임의의 실수 \(k, l\in\mathbb{R}\)에 대해 아래와 같은 성질들을 가집니다.

\(AB \neq BA\)   (모든 \(A, B\)에 대해 성립하는것은 아닙니다.)

\((AB)C = A(BC)\)

\(C(A+B) = CA + CB\)

\((A+B)C = AC + BC\)

\((kA)B = k(AB) = A(kB)\)

 

곱셈에 대한 항등원은 대각선상의 모든 성분이 \(1\)이고 대각성분 외의 나머지 성분들은 모두 \(0\)인 정사각형의 행렬을 말합니다. 단위행렬 \(E\) 또는 \(I\)라고 표현합니다.

 

곱셈에 대한 역원 또한 정칙행렬입니다. 역행렬이라고 하며 행렬\(A\)의 역행렬 \(A^{-1}\)라고 씁니다. 따라서 \(AA^{-1} = I\)가 되는데 이 역행렬에 대해서는 다음 글에서 다룰 것입니다.

 

참고로 이런 곱셈의 특성 때문에 아래와 같은 행렬 특유의 명제들이 밝혀져있습니다.

\(A^2 = 0\)이라고 해서 \(A=O\)인 것은 아니다.

\(AB=O\)이라고 해서 \(A=0\)이거나 \(B=O\)인 것은 아니다.

\(AB=AC\)이고 \(A \neq O\)이라고 해서 \(B=C\)인 것은 아니다.

 

행렬의 전치 (transpose of matrix)

행렬 \(A_{mn}\)의 성분 \(a_{ij}\)에 대해, 행 \(i\)와 열 \(j\)를 교환해서 얻어진 성분 \(a_{ji}\)로 이루어진 행렬 \(A^{\mathsf{T}}\)을 전치행렬(transposed matrix)이라고 합니다. \(A', A^{T}, A^{t}, A^{Tr}\)로 표기하기도 합니다.

 

$$A^{\mathsf{T}} = \begin{bmatrix} \ a_{11} & a_{21} & a_{31} & \cdots & a_{n1} \\ a_{12} & a_{22} & a_{32} & \cdots & a_{n2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{1m} & a_{2m} & a_{3m} & \cdots & a_{nm} \end{bmatrix}$$

 

행렬의 대각성분 \(a_{ij}\) \((i=j)\)부분은 변하지 않으며 행렬의 덧셈과 곱셈이 정의되는 행렬 \(A, B\)와 실수 \(k\in\mathbb{R}\)에 대해 아래와 같은 성질을 보장받습니다.

\((A^{\mathsf{T}})^{\mathsf{T}} = A\)

\((A+B)^{\mathsf{T}} = A^{\mathsf{T}} + B^{\mathsf{T}}\)

\((kA)^{\mathsf{T}} = k(A^{\mathsf{T}})\)

\((AB)^{\mathsf{T}} = B^{\mathsf{T}}A^{\mathsf{T}}\)

 

고졸미필백수
댓글 :
TOP INDEX SEARCH