[머신러닝] Model Selection

데이터의 갯수 n이 predictor p의 갯수와 비슷한 경우 Least Square 는 무용 -> p의 갯수를 의도적으로 줄일 필요가 있음 (불필요한 복잡성 및 true relationship 잘 보이게)

모든 경우의 수 다 해보기(O(2^p) : exponential) -> 비효율적
greedy 정책 활용(O(p^2) : polynomial)
- forward stepwise : p 없 -> p 추가
- backward stepwise : p 풀 -> p 제거

이때, RSS 및 R square는 p의 갯수가 많을 수록 계속 감소 -> 적절한 p의 갯수를 찾을 수 없음

이를 대처하기 위한 다양한 수치식 존재

CV로 근사 test error 추정도 좋은 방법

RSS에 penalty 적용 (제곱 : L2), coef 들을 0에 근사화, OLS의 문제를 해결

RSS에 penalty 적용 (절댓값 : L1), coef 들을 0로 변환

기하학적 해석 상 하나의 coef 축 위에 최적의 coef 값이 존재함.

모든 coef이 중요할 때, 앞선 Lasso 를 사용하기 어렵다 -> predictor를 Z개로 '축소'

PCA + Least Square (차원축소를 통해 충분히 p(Z)갯수가 줄어듦으로 계산이 유의미해짐)

[알고리즘/기초] 피보나치 수 (0)	2023.08.05
[머신러닝] Unsupervised Learning (0)	2023.06.12
[머신러닝] Resampling (1)	2023.06.12
[컴퓨터그래픽스] OpenGL Reflectance Model, Illumination Caculation, Shading Model (0)	2023.06.12
[컴퓨터그래픽스] Parametric Surface, Homogeneous Coordinate, Raytracing (0)	2023.06.12

TaeGyeong Lee