Derek 의 데이터 분석 성장기

3. [인과추론] 무작위 실험(Randomized Control trial) 본문

Data/인과추론

3. [인과추론] 무작위 실험(Randomized Control trial)

Derek Grey 2024. 2. 25. 16:16
반응형

 


RCT(Randomized Control tirals) = 무작위 실험

 

실험 대상자들이 무작위로 두 그룹 중 하나로 배정되는 실험. 하나는 (실험 그룹으로) 테스트 중인 개입을 받고 있는 반면, 다른 하나는 (비교 그룹 또는 대조 그룹으로) 대안적인(전통적인) 치료를 받는 경우

 

 

1. 무작위 실험(RCT) 정의 

RCT는 무작위화 비교 실험으로서, 대조군(Control Group) 과 실험군(Treatment Group) 의 비교를 통해 독립변수가 종속변수에 영향을 미쳤는지 확인하는 과정을 의미합니다.

 

시간적으로, 독립변수(Treatment) 가 먼저 발생하고, 그 후 종속변수(Treatment Effect) 를 입증하기 위해 임의로 독립변수를 의도적인 시기에 발생시키고, 이에 따라 종속변수(Treatment Effect) 변화를 측정합니다. 이는 인과성의 선후관계를 보장하기 위함입니다. 우리가 많이 들었던, A/B Test를 연상하면 이해하기 쉽습니다.(=하지만 인과추론의 RCT는 A/B Test와 완전히 같진 않다고 말하고 있습니다.)

 

인과추론에서는 독립변수만의 효과를 관측하기 위해 RCT에서는 독립변수(Treatment) 을 제외한 종속변수에 영향을 미칠 수 있는 여러 변수들을 통제해야 한다고 말하고 있습니다.

 대표적으로, 독립변수(Treatment) 와 종속변수 Y에 함께 영향을 미치는 교란변수(Confounder) 등이 있습니다. 교란 변수를 통제하고, 이외에 변수들에게 영향을 미치는 Backdoor Path 를 최대한 통제하는 것이 인과추론에서 하나의 변수만의 효과를 관측하는데 굉장히 중요합니다.

 

이는, 비즈니스 관점에서는 A/B Test와 유사합니다. A/B Test의 A와 B군을 나눌 때, Random Sampling으로 무작위 배정을 실행하게 됩니다. 

 그리고, 여기서 무작위 배정이 올바르게 적용 되었다면, 교란변수(=독립변수와 종속변수에 영향을 미치는)와 측정되지 않은 교란변수(Backdoor path)에 대해서도 비교군과 대조군이 함께 균형을 이루기 때문에, RCT는 Treatment 만의 효과를 측정할 수 있습니다.

 

하지만, RCT는 A/B Test보다 상위 개념으로서 단순히 A군과 B군을 나누는 것이 아닌 Control Group과 Treatment Group 이 독립변수를 제외한 모든 환경은 동일하다(Ceteris Paribus) 를 충족하는데 초점을 맞추고 있습니다. 때문에, 최대한 비슷한 연령, 몸무게, 키, 성별 등을 50대 50으로 최대한 통제하여 할당하는 것이 일반적 A/B Test 보다 한 단계 더 통제되거나 주의해야 할 실험이라 할 수 있습니다. (그러나, Random Sampling 이 잘 이루어진다면, 이 조건 또한 보장할 수 있습니다. 하지만, 한번 더 실험군과 통제군을 확인하는 것은 언제나 중요할 것 같습니다.)

 

2. 인과추론의 계층 구조

 

 

위 그림은 인과추론의 Hierarchy(계층구조) 로서 위로 갈수록 신뢰성이 가장 높은 인과관계 실험 구조를 의미하는 것 이다. 즉, 인과관계를 증명하는데 있어 우리가 지금 공부하고 있는 RCT(무작위 실험)은 실험단계가 높은 레벨이며, 아래의 회귀나 후에 배울 Causal Digaram(=Design) 은 신뢰성이 낮은 인과추론 방법이라 할 수 있다.

 

그렇다면, 인관관계를 파악하기 위해서는 무조건적으로 무작위 실험으로 인과성을 추론하면 되겠네?! 라고 생각할 수 있지만! 모든 환경에 다 RCT 를 집행할 순 없습니다.

 

현실에서 실험이 불가능한 환경들이 많기 때문입니다.

 만약 임산부에게 신약을 주입 했을 때의 약물효과를 알고 싶다. 하지만, 검증되지 않은 약물로 임산부에게 신약을 주입 했을 경우 위험성은 태아와 산모에게 굉장히 치명적이다. 때문에, 우리는 신약 실험을 대조군과 실험군을 나누고 자유롭게 실험을 하지 못한다. RCT에도 한계성은 존재합니다.

 

 한가지 더 예시로, 사회제도가 경제 성장에 인과적 효과를 미치는가?를 증명해보고 싶다. 사회제도만으로 그룹군을 나누고 싶지만 '사회제도' 라는 독립변수 하나만의 효과를 관측하기에는 경제 성장에 영향을 미치는 영향요소가 너무 많다.

 예를 들어 국가, 인종, 기후, 인접국 등 많은 변수들이 존재하고 Ceteris Paribus를 충족하는 실험환경을 갖추기 어렵다. 때문에, 이럴때는 RCT가 아닌 Control Group 과 Treatment Group이 최대한 동일한 환경(비슷한 인종 구성,인접한 지역이나 제도만 다른곳, 기후도 비슷한 곳) 등을 찾아 비교를 하는 Quasi-Experiment로 최대한 인과적 효과를 파악해야 한다.

 

RCT로 모든 문제에서 인과성을 파악할 순 없다. 그럴때는, 다른 실험설계를 통해 인과추론을 해야 하는 것 이다. 하지만, 그럼에도 불구하고 RCT는 일반적으로 가장 높은 신뢰성을 가진 인과추론 방법임에는 틀림이 없다.

 

 

3. RCT 의 강점

 

우리는 앞장에서, 관측할 수 있는 Treatment Effect(독립변수의 효과 = 치료효과) 를 알기 위해서는 ATT + Selection Bias 를 파악해야 한다고 정의했다. 여기서 ATT는 두 그룹간의 평균효과이고, Selection Bias는 독립변수(치료)를 본인들이 선택했기 때문에, 생길 수 있는 선택편향이라고 설명했다.

 에를 들어, 태블릿 PC는 학교 성적에 영향을 미친다 라는 가설을 설정했다. 태블릿 PC 선택여부는 학생들이 직접 선택한 것이기 때문에 선택편향이 생기는 것이다. 

 하지만, RCT는 무작위로 실험군과 대조군을 할당했기 때문에, 이러한 Selection Bias를 제거한다. 

 

Brady Neal 강의 속에서도, RCT는 두 가지 조건을 충족한다고 설명하고 있습니다.

 1. RCTs : T cannot have any causal parents(=치료효과는 어떤 부모 인과성도 가지지 않는다.)

 2. 그룹들은 모두 유사하다.(Condition = Confounder 차이는 존재하지 않는다.)

 

말을 한번 더 풀자면, RCT는 교란변수를 모두 통제하는 것이며, 그룹들은 모두 유사한 특성을 가지고 있다고 의미하는 것 입니다. 즉, Random Sampling 은 교란변수를 통제(=없애는)데 중요한 역할을 합니다. A/B Test 에도 랜덤 샘플링이 중요

시 되는 것 또한 교란변수를 통제하고 인과관계를 추론하는데 효과적으로 작용한다고 말할  수 있습니다.

 

4. Wrap-Up

 

RCT(무작위 실험) 은 대조군과 실험군을 무작위로 할당하여, 독립변수가 종속변수에 영향을 미치는 인과성을 파악하기 위한 신뢰도 높은 인과추론 실험설계이다. 하지만, 우리가 사는 현실에 모두 대조군과 실험군을 나누어 실험을 집행할 순 없다. 이럴때는, Quasi-Experiment 등 다른 실험 설계를 차용해야 한다. 그럼에도 불구하고, 독립변수의 효과를 측정하는데 있어 우리가 우려하던 교란변수, 그리고 두 집단은 독립변수 이외의 조건은 유사하다. 라는 조건을 만족시키는데 실험설계임은 틀림이 없다.

 A/B Test와 다른점은 A/B Test는 주로 제품 또는 서비스 변화에 대한 효과를 평가하는데 초점을 맞춘다. 하지만, RCT는 주로 의학 및 사회과학 연구에서 치료나 정책의 효과를 평가하는데 초점이 맞추어져 있다.


반응형