일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- backdoor adjustment
- residuals
- 크롤링
- 머신러닝
- 교란 변수
- HTML
- rct
- 잔차의 성질
- 인과 추론
- Omitted Variable Bias
- LU분해
- simple linear regression
- least square estimation
- 인과추론
- 교란변수
- 누락편의
- 회귀불연속설계
- causal inference
- 예제
- 최소제곱법
- Instrumental Variable
- 통계
- confounder
- 선형대수
- Sharp RD
- 사영
- Python
- OVB
- 네이버 뉴스
- 단순선형회귀
- Today
- Total
목록인과추론(Causal Inference) (18)
Always awake,

본 포스팅은 인과추론을 위한 sub sampling 기법 중 하나인 성향 점수 매칭(propensity score matching)에 대해 정리한 글입니다 :) 개요 처치가 결과에 미치는 영향을 추론(인과 추론)하기 위해서는 처치를 받은 집단(실험군)과 받지 않은 집단(대조군)을 비교해야 합니다. 그리고 반드시 처치를 제외한 다른 조건은 두 집단 간 평균적으로 동일해야 합니다. 그래야 편향 없이 처치가 결과에 미치는 영향을 추론할 수 있습니다 하지만 현실에서는 처치 자체가 특정 요인에 영향을 받으며, 특정 요인이 결과에도 영향을 미치는 경우가 많습니다. 이를 교란 요인 (교란 변수) 이라고 합니다. 이러한 경우 교란 요인이 처치 여부에 미치는 영향을 제거해야 올바른 인과 효과를 추정할 수 있습니다. 즉,..

본 포스팅은 Offline Policy Evaluation에 대해 정리한 글입니다. 아래의 내용을 참고하였습니다 Offline Policy Evaluation: Run fewer, better A/B tests How offline policy evaluation works, examples on how to use it, and lessons learned from building OPE at Facebook edoconti.medium.com OPE 개요 우리는 비즈니스에서 목표(매출, 클릭율, 접속)를 개선하기 위해 의사결정을 하기 위해 A/B test에 많은 시간 및 자원을 소비하고 있습니다. 예를 들면 사용자의 클릭율 측면에서 어떤 UI가 좋은지 의사결정을 하기 위해 여러 안을 구성하고 접속한 ..

Causal Discovery의 개념과 그 중 대표적인 알고리즘인 PC algorithm에 대해 정리한 글입니다. 아래 그림의 출처는 [Youtube] [Session 18-3] 데이터 기반의 인과관계 발견(Causal Discovery)입니다 인과 다이어그램이란 변수 간의 인과관계를 도식화 한 것을 인과다이어그램(Causal Diagram)이라고 합니다. 동그라미로 표시된 노드는 변수를 의미하고, 화살표로 표시된 엣지는 두 변수 간 직접적인 인과 관계를 의미합니다 (화살표가 나가는 노드가 원인, 화살표가 향하는 노드가 결과입니다) 인과 다이어그램을 왜 그릴까요? 우리의 관심사인 원인과 결과 간의 인과관계를 알기 위해서입니다. 두 변수 간 인과관계를 확인하기 위해 통제해야할 path 및 노드(변수)를 규..

개요 우리는 실험이 필요하다 이전 인과분석 방법론 포스트에서 우리는 교란 요인을 제거하고 원인 변수의 효과를 확인하기 위해서는 RCT(Radomized Control Trials)가 필요하다고 하였습니다. 관찰된 데이터(observational data)에서는 교란 요인의 영향이 존재할 가능성이 높고, 교란 요인에 의해 처치가 결정되는 자기 선택 편향(selection bias)이 발생합니다. 때문에 원인 변수(처치)를 기준으로 두 집단을 나누어도 처치 이외의 특성이 평균적으로 동일하지 않게 되고 결국 두 집단을 비교한 결과가 인과 효과가 아니라는 것입니다.(참고 : 교란 변수) 물론 교란 요인을 통제하여 인과 효과를 측정할 수 있습니다. 하지만, 교란 요인이 무엇인지 알기 힘들 뿐더러 모든 교란 요인을..

본 포스팅은 불연속회귀설계를 이용한 인과 효과 추정에 관한 예제입니다 :) 아래의 포스팅을 참고하시면 좋습니다. 불연속회귀설계(RDD) 본 포스팅은 불연속회귀설계에 관해 정리한 내용입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.146 ~ p.175 참고 사이트 : https://mixtape.scu.. everyday-tech.tistory.com 본 포스팅에서는 불연속회귀설계 모델 중 임계값 전 후로 처치가 고정적으로 정해지는 Sharp RD에 대해 다루겠습니다 예제 데이터 생성 먼저 필요한 패키지를 import합니다 import numpy as np import pandas as pd impor..

본 포스팅은 이중차분법을 활용한 인과 효과 측정 예제입니다 :) 이중차분법에 대한 내용은 아래의 포스팅을 참고하시면 좋습니다. 이중차분법(DID) 본 포스팅은 이중 차분법에 대해 공부한 내용을 정리한 글입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.178 ~ p.190 이중 차분법 컨셉 이중.. everyday-tech.tistory.com 예제 데이터를 생성하여 두 가지 방식으로 이중 차분 값(인과 효과)을 측정해보겠습니다. 예제 데이터 생성 총 10개의 time stamp에 대해 처치 그룹(treated group)과 통제 그룹(control group) 각각의 결과 변수(outcome)입니다 ..