일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 크롤링
- Omitted Variable Bias
- 선형대수
- Python
- 머신러닝
- backdoor adjustment
- 단순선형회귀
- rct
- 예제
- 인과추론
- 사영
- 네이버 뉴스
- OVB
- 교란변수
- 잔차의 성질
- Instrumental Variable
- 최소제곱법
- 누락편의
- 회귀불연속설계
- 통계
- LU분해
- causal inference
- HTML
- Sharp RD
- 인과 추론
- simple linear regression
- least square estimation
- 교란 변수
- confounder
- residuals
- Today
- Total
목록분류 전체보기 (47)
Always awake,

"현재 인과추론 패키지 개발 업무 중 거리 기반 매칭 기능을 조사하며 얻은 지식을 정리하였습니다 :) 마할라노비스 거리를 구하는 방법에 대해 기술합니다" 마할라노비스 거리 $n$개의 샘플이 있고, 각 샘플은 $k$차원 공간(feature의 수)의 벡터로 표현된다고 합시다 그리고 임의의 두 개의 샘플에 대한 $1 \times k$ 형태의 행 벡터가 $\vec{v} = (v_1, v_2, ..., v_{k-1}, v_k)$과 $\vec{u} = (u_1, u_2, ..., u_{k-1}, u_k)$일 때 마할라노비스 거리의 정의는 아래와 같습니다 $$ mahalanobis(\vec{v}, \vec{u}) = \sqrt{(\vec{v} - \vec{u}) {\sum}^{-1} (\vec{v} - \vec{u}..

"행 관점에서의 행렬 연산, 가우스 소거법으로 역행렬을 구하는 방법&증명 내용입니다" 행 관점에서의 행렬 변환 행 관점 행렬 $D,A,A^*$가 있을 때 아래 식의 의미는 "$A$ 행렬에 $D$ 연산을 하여 $A^*$ 행렬을 만든다" 입니다. 행렬 $A$에 어떤 연산 $D$를 취하여 변환한 행렬이 $A^*$ 인 것입니다 $$ DA = A^* $$ $$ (A \xrightarrow{D} A^*) $$ 자세히 보면 $A$의 각 행을 잘 조합하여 $A^*$ 가 만들어진다는 규칙을 알 수 있습니다 $A$의 각 행을 재료로 하고, 이를 조합하여($D$) 행렬 $A^*$를 만듭니다 변환 역할을 담당하는 행렬 $D$의 각 행의 값들이 $A^*$의 동일한 행에 영향을 미치는 것을 알 수 있습니다 예를 들면 $D$의 1..

팀원분께서 두 벡터의 correlation이 갖는 기하학적 의미에 대해 공유해주신 내용을 공부하여 정리해보았습니다 :) (팀원분께 무한한 감사를! 👍) 사전 지식 correlation을 기하학적으로 이해하기 위해서는 벡터의 사영(projection)에 대한 이해가 필요합니다 (Orthogonal 벡터 만들기 참고) 두 벡터 $\vec{u} = (u_1, u_2, ..., u_n)$, $\vec{v} = (v_1, v_2, ..., v_n)$가 주어져 있고, 두 벡터의 각도가 $\theta$일 때, 정리1. 두 벡터 $\vec{u}$, $\vec{v}$가 이루는 각도 $\theta$의 코사인 값은 아래와 같다 $$ cos(\theta) = \frac{\vec{u} \cdot \vec{v}}{|\vec{u}..

본 포스팅은 인과추론을 위한 sub sampling 기법 중 하나인 성향 점수 매칭(propensity score matching)에 대해 정리한 글입니다 :) 개요 처치가 결과에 미치는 영향을 추론(인과 추론)하기 위해서는 처치를 받은 집단(실험군)과 받지 않은 집단(대조군)을 비교해야 합니다. 그리고 반드시 처치를 제외한 다른 조건은 두 집단 간 평균적으로 동일해야 합니다. 그래야 편향 없이 처치가 결과에 미치는 영향을 추론할 수 있습니다 하지만 현실에서는 처치 자체가 특정 요인에 영향을 받으며, 특정 요인이 결과에도 영향을 미치는 경우가 많습니다. 이를 교란 요인 (교란 변수) 이라고 합니다. 이러한 경우 교란 요인이 처치 여부에 미치는 영향을 제거해야 올바른 인과 효과를 추정할 수 있습니다. 즉,..

본 포스팅은 Offline Policy Evaluation에 대해 정리한 글입니다. 아래의 내용을 참고하였습니다 Offline Policy Evaluation: Run fewer, better A/B tests How offline policy evaluation works, examples on how to use it, and lessons learned from building OPE at Facebook edoconti.medium.com OPE 개요 우리는 비즈니스에서 목표(매출, 클릭율, 접속)를 개선하기 위해 의사결정을 하기 위해 A/B test에 많은 시간 및 자원을 소비하고 있습니다. 예를 들면 사용자의 클릭율 측면에서 어떤 UI가 좋은지 의사결정을 하기 위해 여러 안을 구성하고 접속한 ..

Causal Discovery의 개념과 그 중 대표적인 알고리즘인 PC algorithm에 대해 정리한 글입니다. 아래 그림의 출처는 [Youtube] [Session 18-3] 데이터 기반의 인과관계 발견(Causal Discovery)입니다 인과 다이어그램이란 변수 간의 인과관계를 도식화 한 것을 인과다이어그램(Causal Diagram)이라고 합니다. 동그라미로 표시된 노드는 변수를 의미하고, 화살표로 표시된 엣지는 두 변수 간 직접적인 인과 관계를 의미합니다 (화살표가 나가는 노드가 원인, 화살표가 향하는 노드가 결과입니다) 인과 다이어그램을 왜 그릴까요? 우리의 관심사인 원인과 결과 간의 인과관계를 알기 위해서입니다. 두 변수 간 인과관계를 확인하기 위해 통제해야할 path 및 노드(변수)를 규..