Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- least square estimation
- causal inference
- confounder
- residuals
- Sharp RD
- 회귀불연속설계
- 교란변수
- Omitted Variable Bias
- 머신러닝
- 인과 추론
- simple linear regression
- backdoor adjustment
- rct
- OVB
- 네이버 뉴스
- 통계
- 인과추론
- 선형대수
- Instrumental Variable
- 크롤링
- 예제
- LU분해
- Python
- 누락편의
- 교란 변수
- 잔차의 성질
- 최소제곱법
- 단순선형회귀
- HTML
- 사영
Archives
- Today
- Total
목록Xgboost (1)
Always awake,
하나의 예측값만 나오는 문제(Tree 모델)
현상 요약 Tree모델에서 train데이터로 학습하고, train 데이터로 예측하였을 때 예측값이 하나만 나오는 경우가 발생하여 원인을 확인하고자 한다 원인 생각 곰곰히 생각해본 결과 node가 분할되지 않았기 때문이라는 결론을 내렸다 즉, root node에서 분할되지 않았기 때문에(root node만 존재) 어떤 input feature가 들어와도 root node의 평균 값만 내뱉는 것이다 ※ 위의 현상이 발생한 ensemble 모델의 경우, 각 tree의 root node 평균값에 tree들의 가중치를 취하여 더한 값이 예측 값으로 나올 것이다 그러면 어떠한 경우에 분할이 발생하지 않을까? 각 모델 특성별로 root node에서 분할되지 않는 경우를 생각해 보았다 원인 1 data point(sa..
머신러닝
2022. 3. 16. 02:56