일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 선형대수
- 누락편의
- 통계
- LU분해
- 인과 추론
- simple linear regression
- 교란변수
- 크롤링
- Instrumental Variable
- 회귀불연속설계
- OVB
- Omitted Variable Bias
- HTML
- 교란 변수
- causal inference
- 인과추론
- rct
- backdoor adjustment
- confounder
- least square estimation
- 네이버 뉴스
- 예제
- Python
- Sharp RD
- 머신러닝
- 단순선형회귀
- 잔차의 성질
- 사영
- residuals
- 최소제곱법
- Today
- Total
목록causal inference (12)
Always awake,

본 포스팅은 인과추론을 위한 sub sampling 기법 중 하나인 성향 점수 매칭(propensity score matching)에 대해 정리한 글입니다 :) 개요 처치가 결과에 미치는 영향을 추론(인과 추론)하기 위해서는 처치를 받은 집단(실험군)과 받지 않은 집단(대조군)을 비교해야 합니다. 그리고 반드시 처치를 제외한 다른 조건은 두 집단 간 평균적으로 동일해야 합니다. 그래야 편향 없이 처치가 결과에 미치는 영향을 추론할 수 있습니다 하지만 현실에서는 처치 자체가 특정 요인에 영향을 받으며, 특정 요인이 결과에도 영향을 미치는 경우가 많습니다. 이를 교란 요인 (교란 변수) 이라고 합니다. 이러한 경우 교란 요인이 처치 여부에 미치는 영향을 제거해야 올바른 인과 효과를 추정할 수 있습니다. 즉,..

개요 우리는 실험이 필요하다 이전 인과분석 방법론 포스트에서 우리는 교란 요인을 제거하고 원인 변수의 효과를 확인하기 위해서는 RCT(Radomized Control Trials)가 필요하다고 하였습니다. 관찰된 데이터(observational data)에서는 교란 요인의 영향이 존재할 가능성이 높고, 교란 요인에 의해 처치가 결정되는 자기 선택 편향(selection bias)이 발생합니다. 때문에 원인 변수(처치)를 기준으로 두 집단을 나누어도 처치 이외의 특성이 평균적으로 동일하지 않게 되고 결국 두 집단을 비교한 결과가 인과 효과가 아니라는 것입니다.(참고 : 교란 변수) 물론 교란 요인을 통제하여 인과 효과를 측정할 수 있습니다. 하지만, 교란 요인이 무엇인지 알기 힘들 뿐더러 모든 교란 요인을..

본 포스팅은 불연속회귀설계를 이용한 인과 효과 추정에 관한 예제입니다 :) 아래의 포스팅을 참고하시면 좋습니다. 불연속회귀설계(RDD) 본 포스팅은 불연속회귀설계에 관해 정리한 내용입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.146 ~ p.175 참고 사이트 : https://mixtape.scu.. everyday-tech.tistory.com 본 포스팅에서는 불연속회귀설계 모델 중 임계값 전 후로 처치가 고정적으로 정해지는 Sharp RD에 대해 다루겠습니다 예제 데이터 생성 먼저 필요한 패키지를 import합니다 import numpy as np import pandas as pd impor..

본 포스팅은 이중차분법을 활용한 인과 효과 측정 예제입니다 :) 이중차분법에 대한 내용은 아래의 포스팅을 참고하시면 좋습니다. 이중차분법(DID) 본 포스팅은 이중 차분법에 대해 공부한 내용을 정리한 글입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.178 ~ p.190 이중 차분법 컨셉 이중.. everyday-tech.tistory.com 예제 데이터를 생성하여 두 가지 방식으로 이중 차분 값(인과 효과)을 측정해보겠습니다. 예제 데이터 생성 총 10개의 time stamp에 대해 처치 그룹(treated group)과 통제 그룹(control group) 각각의 결과 변수(outcome)입니다 ..

본 포스팅은 불연속회귀설계에 관해 정리한 내용입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.146 ~ p.175 참고 사이트 : https://mixtape.scunning.com/regression-discontinuity.html 불연속 회귀 설계는 언제 사용하나요 불연속 회귀 설계(RDD; Regression Discontinuity Design)는 인과 추론 방법 중 하나입니다. 해당 방법은 처치(treatment)가 특정 제약 조건이나 자격 하에 정해지는 경우에 사용합니다. 처치가 랜덤하게 배정되지 않기 때문에 실험군, 대조군 간 처치를 제외한 다른 특성이 동일하지 않은 경우입니다. 어떤 ..

본 포스팅은 이중 차분법에 대해 공부한 내용을 정리한 글입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.178 ~ p.190 이중 차분법 컨셉 이중 차분법은 원인변수와 결과변수 간의 인과 효과를 측정하기 위한 인과 추론 방법입니다 인과 추론 시 데이터의 특성과 생성되는 상황에 따라 적절한 방법을 선택하여 사용하는데 그 중 이중 차분법에 대해 설명하고자 합니다. 이중 차분법(DID; Difference In Difference)은 도구 변수(Instrumental Variable)과 회귀불연속설계(RDD; Regression Discontinuity Design)의 적용이 어려울 때 사용할 수 있습니다..