인과추론팀
가짜연구소 소속
•
비영리 AI/Data Science 연구 공동체
•
공유의 가치를 실현하자!
진행 프로젝트
컨퍼런스
Time Table
•
진행은 우측 스케줄러대로 진행함.
•
한빛미디어 리더스홀에서 진행하였고 거진 80~90명은 오신 것 같았다.
•
오신 분들은 보통 데이터 관련 직무를 하시며 보통 야X자, 넷X블, 크XX톤, 쏘카 등등 마케팅에 사용되는 지표들을 중요하게 생각하는 업계분들이 많이 오셨다.
세미나
Causal Inference with CasusalML
인과 추론이란?
•
상하 관계가 있는
•
인과추론 데이터과학 발췌 사진
◦
메타 분석
◦
RCT 무작위화 비교실험 (A/B 테스트)
◦
준 실험 방법 (ex. 이중 차분법)
◦
도구 변수
◦
설계된 회귀 분석
◦
회귀 분석
•
연관 관계 인과 관계
•
연관 관계 = 인과 관계 + Bias
•
Bias를 0으로 만들면 인과추론이 쉬워지겠구나 →
•
실무로 통하는 인과추론
•
CausalML
◦
조건부 평균 치료 효과(CATE)
◦
개별 치료 효과(ITE) 추정 표준 인터페이스 제공
•
기본적으로 모델 형태에 대한 강력한 가정 없이 관찰된 특징 X를 가진 사용자에 대한 개입 W의 결과 Y에 대한 인과적 영향을 추정한다.
•
META 분석 T-Learner
•
CausalML 패키지
◦
뉴럴 네트워크도 지원함
•
회귀분석으로 처치 효과 구하기
◦
ATE, CATE
◦
리텐션이 좋아지긴 함.
구분 | Effect |
ATE | 1.52% |
CATE(x = 누적 결제 금액) | X가 커질수록 증가 |
▪
돈 많이 쓰는 거
▪
자주 사용하는 고객 등
마케팅 사이언스: Marketing Data Analytics & Bayesian Statistics
•
관찰된 결과와 관측된 결과는 같지 않다.
•
처치(원인)이 명확하게 정의되어야 한다.
•
Causal Consistency를 고려
•
Counterfactual treatment
•
관측 - 쪼개서 봄으로써 Causal Consistancy 고려
Lang2SQL: 오픈소스 쿼리생성
문제
•
데이터 추출 작업에 많은 리소스를 들이지 않고도 원하는 결과를 얻는 것
•
데이터 추출 카탈로그를 보고 알아서 하라고 하고싶지도 않는다.
•
모두가 더 가치 있는 일에 집중할 수 있기를 바람.
Adaptive Designs and Master Protocols
•
모집단에서 표본을 뜯어서 데이터 분석을 진행
•
Advanced clinical trial design 개념
•
Adaptive design과 master protocol에 대해 기초를 알려주는 책을 읽고 내용을 정리한다.
•
Oncology와 같은 분야에서 활발하게 활용되고 있지만, Medical Device나 디지털 치료기기에도 충분히 활용될 수 있다.
•
Interim analysis
◦
Sample size 변경 가능
◦
Target subpopulation 설정 후 interim analysis 이후에 해당 population에서 대상자 모집 가능
◦
새로운 Treatment 군 추가 또는 기존 군 탈락 가능(dose-ranging trial)
◦
종쟝학 연구 가능
•
Master Protocol
◦
일반적으로 하나의 임상시험 연구에는 하나의 프로토콜 (임상시험계획서)이 활용된다.
◦
Master protocol에서는 여러 가지 임상시험 연구를 한다.
◦
종류
▪
Basket trial
▪
Umbrella trial
▪
Platform trial
•
Statisticians don’t wait for the Moment, They Generate Them!