LDA fisher analysis

통계

LDA fisher analysis

NowChan 2022. 1. 1. 13:48

벡터 사영:

U로 V를 사영한 벡터:

$\operatorname{proj}_UV=\frac{V\cdot U}{\left|\left|{U}\right|\right|^2}U$

$y=w^Tx$

|w|=1, w의 방향은 x와 곱할 때 정해져 있어서 따로 붙히지 않고, y는 1차원 벡터(스칼라)

클레스가 2개일 때

클래스 i의 평균 벡터:

$m_i=\frac{1}{n_i}\sum _{x\in D_i\ }^{\ }x\tag{1}$

직선에 projection 시킨 클래스 i의 평균 벡터:

$\tilde{m_i}=\frac{1}{n_i}\sum _{y\in Y_i\ }^{\ }y=\frac{1}{n_i}\sum _{x\in D_i\ }^{\ }w^Tx=w^Tm_i\tag{2}$

클레스 1, 2 사이의 거리(between-class scatter):

$\left|{\tilde{m_1}}-\tilde{m_2}\right|=\left|{w^T\left(m_1-m_2\right)}\right|\tag{3}$

$\left|\tilde{m_1}-\tilde{m_2}\right|^2$

$\\ =\left\{w^T\left(m_1-m_2\right)\right\}^2$

$\\ =w^T\left(m_1-m_2\right)w^T\left(m_1-m_2\right)$

$\\ =w^T\left(m_1-m_2\right)\left\{w^T\left(m_1-m_2\right)\right\}^T \tag{4}$

$\\ =w^T\left(m_1-m_2\right)\left(m_1-m_2\right)^Tw$

$\\ =w^TS_Bw$

4번식의 경우, w^T는 1xd 행렬, m1-m2는 dx1 행렬이므로 결과가 스칼라이기 때문에 transpose하더라도 같은 값이라는 점을 이용한 것이다.

클래스 내 분산(within-class scatter):

$\tilde{s_1}^2+\tilde{s_2}^2\ \tag{5}$

$\\ =\sum _{y\in Y_1}^{\ }\left(y-\tilde{m_1}\right)^2+\sum _{\ y\in Y_2}^{\ }\left(y-\tilde{m_2}\right)^2$

$\\ =\sum _{\ i=1}^{\ 2}\sum _{\ y\in Y_i}^{\ }\left(y-\tilde{m_i}\right)^2$

$\\ =\sum _{\ i=1}^{\ 2}\sum _{\ y\in Y_i}^{\ }\left(w^Tx-w^Tm_i\right)^2$

$\\ =\sum _{\ i=1}^{\ 2}\sum _{\ y\in Y_i}^{\ }\left(w^Tx-w^Tm_i\right)\left(w^Tx-w^Tm_i\right)$

$\\ =\sum _{\ i=1}^{\ 2}\sum _{\ y\in Y_i}^{\ }w^T\left(x-m_i\right)w^T\left(x-m_i\right)$

$\\ =\sum _{\ i=1}^{\ 2}\sum _{\ y\in Y_i}^{\ }w^T\left(x-m_i\right)\left(x-m_i\right)^Tw$

$\\ =w^TS_Ww$

목적 함수:

$J\left(w\right)=\frac{\left|{\tilde{m_1}-\tilde{m_2}}\right|^2}{\tilde{s_1}^2+\tilde{s_2}^2\ }\ =\frac{w^TS_Bw}{w^TS_Ww}\tag{6}$

우리가 찾는 것은 목적 함수를 최대로 만드는 w를 찾는 것이다.

$\frac{d}{dw}J\left(w\right)=\frac{d}{dw}\frac{w^TS_Bw}{w^TS_Ww}=0 \tag{7}$

$=\frac{\left[\frac{d}{dw}w^TS_Bw\right]\left[w^TS_Ww\right]-\left[\frac{d}{dw}w^TS_Ww\right]\left[w^TS_Bw\right]}{\left(w^TS_Ww\right)^2}$

$=\frac{2S_Bw\left[w^TS_Ww\right]-2S_Ww\left[w^TS_Bw\right]}{w^TS_ww}\tag{8}$

$=2S_Bw-2S_Ww\frac{w^TS_Bw}{w^TS_Ww}=0$

$\\ S_Bw-S_WwJ\left(w\right)=0\tag{9}$

$\\ S_Bw-\lambda S_Ww=0$

9번 식에서 J(w)는 하나의 w에 대해 스칼라이므로 λ로 표현 가능하다. ?

8번식 과정

$\frac{d}{dw}w^TS_Bw=w^T\left(S_B+S_B^T\right)\\$

$=w^T\left(S_B+S_B^T\right)\left[w^TS_Ww\right]\\$

$=2w^TS_B\left[w^TS_Ww\right]$

S_B의 결과 자체가 스칼라라서 같다고 나오는듯?

$\frac{d}{dX}X^TAX=X^T\left(A+A^T\right)$

[행렬 X에 대해 미분]

고유 벡터 꼴

$\\ S_W^{-1}S_Bw-\lambda w=0$

$\\ S_W^{-1}S_Bw=\lambda w\tag{10}$

클레스가 여러 개일 때

multi class fisher LDA

$J\left(w\right)=\frac{\left|{\tilde{S_B}}\right|}{\left|{\tilde{S_W}}\right|}$

클래스 i의 분산의 합 = S_W

$S_W=\sum _{i=1\ }^{\ c}S_i=\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(x-m_i\right)\left(x-m_i\right)^T$

전체 데이터 집합에 대한 분산 = 클래스 간 분산 + 각 클래스 내 분산

$S_T=S_B+S_W$

$m=\frac{1}{n}\sum _{i=1}^cn_im_i$

$\\ S_T=\sum _{\ x}^{\ }\left(x-m\right)\left(x-m\right)^T$

$\\ =\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(x-m_i+m_i-m\right)\left(x-m_i+m_i-m\right)^T$

$\\ =\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(x-m_i\right)\left(x-m_i\right)^T\ +\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(m_i-m\right)\left(m_i-m\right)^T$

$\\ =S_{W\ }+\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(m_i-m\right)\left(m_i-m\right)^T$

클래스 간 분산

$\\ S_B=\sum _{\ i=1}^{\ c}\sum _{\ x\in D_i}^{\ }\left(m_i-m\right)\left(m_i-m\right)^T$

10번 식에 각 값을 대입하면 된다.

목표 함수

$J\left(w\right)=\frac{\left|{\tilde{S_B}}\right|}{\left|{\tilde{S_W}}\right|}=\frac{\left|{W^TS_BW}\right|}{\left|W^TS_WW\right|}$

출처:

https://darkpgmr.tistory.com/141

https://lutecevision.tistory.com/1

https://knowable.tistory.com/41

'통계' 카테고리의 다른 글

RMSprop, Adam 알고리즘 해설 (0)	2021.12.26
다중공선성 (multicollinearity) (0)	2021.12.18

현재글LDA fisher analysis

공부한 것을 기록하는 곳

scikit learn, truncated svd, stackign ensemble, okt, 피마 인디언 당뇨병 예측, NMF, nlp, konlpy, Mercari Price Suggestion Challenge, Kaggle, LightGBM, LinearRegression, WordNetLemmatizer, SentimentIntetsityAnalyzer, 결정 트리, DBSCAN, clustering, kmeans, 파이썬 머신러닝 완벽 가이드, Silhouette Evaluation,

my-github

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

공부 기록