일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 인과 추론
- 최소제곱법
- simple linear regression
- 선형대수
- 통계
- rct
- Python
- 크롤링
- 교란변수
- 인과추론
- 누락편의
- backdoor adjustment
- confounder
- causal inference
- residuals
- 교란 변수
- HTML
- Instrumental Variable
- 머신러닝
- 잔차의 성질
- 사영
- 네이버 뉴스
- 회귀불연속설계
- least square estimation
- Sharp RD
- OVB
- LU분해
- 단순선형회귀
- 예제
- Omitted Variable Bias
- Today
- Total
목록분류 전체보기 (47)
Always awake,

본 포스팅의 모든 출처는 edwith의 고려대학교 주재걸 교수님의 "인공지능을 위한 선형대수" 강좌입니다 좋은 강의를 제공해주신 교수님께 감사드립니다 :) 인공지능을 위한 선형대수 강좌소개 : edwith - 주재걸 교수 www.edwith.org 회귀분석에서 다음과 같은 문제를 푼다고 합시다 키, 몸무게, 흡연여부가 수명에 미치는 영향을 확인하고 싶은 것입니다. 이 때 우리가 풀 연립방정식은 아래와 같습니다 $60x_1 + 5.5x_2 + 1x_3 = 66$ $65x_1 + 5.0x_2 + 0x_3 = 74$ $55x_1 + 6.0x_2 + 1x_3 = 78$ 이를 아래와 같이 matrix와 vector로 표현할 수 있습니다 그리고 $A$의 컬럼 벡터(column vector)를 이용하여 아래와 같이 ..

본 포스팅은 조건부 기댓값에 대해 공부한 내용을 정리한 글입니다 :) 아래의 링크를 참고하였습니다 7.6 조건부기댓값과 예측 문제 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net 조건부 확률 조건부 확률은 두 확률 변수 X,Y에 대해 하나의 확률 변수가 "주어졌을 때" 나머지 확률 변수가 나타날 확률을 의미합니다. $$p(Y|X) = \frac{p(Y \cap X)}{p(X)}$$ 예를 들어 이산 확률 변수 X,Y의 결합 확룔(joint distribution)이 아래와 같다고 합시다 X는 1,2,3의 값을 갖으며, Y = 1,2의 값을 갖을 수 있습니다. 그리고 가능한 모든 확률의 합은 1입니다 $Y$ $1$ $..

본 포스팅은 불연속회귀설계를 이용한 인과 효과 추정에 관한 예제입니다 :) 아래의 포스팅을 참고하시면 좋습니다. 불연속회귀설계(RDD) 본 포스팅은 불연속회귀설계에 관해 정리한 내용입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.146 ~ p.175 참고 사이트 : https://mixtape.scu.. everyday-tech.tistory.com 본 포스팅에서는 불연속회귀설계 모델 중 임계값 전 후로 처치가 고정적으로 정해지는 Sharp RD에 대해 다루겠습니다 예제 데이터 생성 먼저 필요한 패키지를 import합니다 import numpy as np import pandas as pd impor..

신뢰성 분석에 관한 내용을 정리한 포스팅입니다 :) 신뢰성(Reliability)이란 품질과 신뢰성은 개념이 다릅니다. 제품을 생산하고 품질 체크를 한 후 이상이 없으면 최종 완제품 판정을 하고 출고를 하죠 품질은 해당 제품을 생산하는 관점이라고 하면, 신뢰성은 출고 이후 제품을 실사용하게 될 때의 관점입니다. 즉 어떤 제품이나 시스템이 규정된 사용 조건, 의도하는 기간 동안 정해진 기능을 고장 없이 수행할 수 있는가에 관한 특성입니다. 신뢰성의 척도 신뢰성을 측정하는 대표적인 방식은 해당 제품 or 서비스의 고장이 발생할 때까지의 시간인 고장 시간($T$)입니다 수명분포(lifetime distribution) 고장이 발생할 때까지의 시간($T$)는 제품의 수명을 나타내므로 해당 변수의 분포를 수명분포..

로지스틱 회귀에 대한 개념, 수식 관련 포스팅입니다 :) 통계수업에서 가장 먼저 배우는 회귀 모델은 단순 선형 회귀(Simple Linear Regression)입니다. 종속변수와 독립변수가 각각 하나씩 존재하고, 독립변수와 종속변수의 관계가 선형인 회귀 모델입니다. 해당 모델은 종속변수가 실수값을 가지는 형태이고 가장 기초적인 모델이지만, 머신러닝을 배우면서 분류(Classification)문제를 접하게되면 해당 모델을 사용할 수 없게 됩니다. 그 이유는 분류 모델에서 종속변수는 하나의 class를 나타내는 "범주형" 변수이기 때문입니다. 즉, 실수형 변수와 다르게 값의 크기와 방향이 존재하지 않는 변수인 것입니다. 이런 문제로 탄생한 분류 모델이 로지스틱 회귀(Logistic Regression)입니..

본 포스팅은 이중차분법을 활용한 인과 효과 측정 예제입니다 :) 이중차분법에 대한 내용은 아래의 포스팅을 참고하시면 좋습니다. 이중차분법(DID) 본 포스팅은 이중 차분법에 대해 공부한 내용을 정리한 글입니다 :) 참고 서적 : Joshua D. Angrist, Jorn-Steffen Pischke. (2018). 고수들의 계량경제학. 시그마프레스. p.178 ~ p.190 이중 차분법 컨셉 이중.. everyday-tech.tistory.com 예제 데이터를 생성하여 두 가지 방식으로 이중 차분 값(인과 효과)을 측정해보겠습니다. 예제 데이터 생성 총 10개의 time stamp에 대해 처치 그룹(treated group)과 통제 그룹(control group) 각각의 결과 변수(outcome)입니다 ..