Search

중심 극한 정리

대분류
인공지능/데이터
소분류
통계 실험
유형
확률과 통계
부유형
중심 극한
주요 레퍼런스
https://drhongdatanote.tistory.com/57
최종 편집 일시
2024/10/29 05:06
생성 일시
2024/08/22 06:24
13 more properties

중심극한정리(Central Limit Theorem, CLT)

통계학에서 매우 중요한 개념으로, 모집단의 분포와 상관없이 표본 평균의 분포가 큰 표본 크기에서 정규분포에 가까워진다는 내용을 담고 있다.
이 정리는 많은 통계적 방법론의 기초를 형성한다.
어떤 모집단에서 많은 표본을 뽑아서 그 평균을 구하면 이 평균들이 모여서 만드는 분포는 정규분포(종 모양의 분포)에 가까워진다는 것
모집단이 정규분포일 필요가 없다.
표본을 많이 뽑아 그 평균을 구하면, 그 평균들의 분포는 정규분포처럼 보이게 된다.

중심극한정리의 정의

중심극한정리는 다음과 같이 정의된다:
모집단: 평균이 μμ이고 분산이 σ2σ^2인 모집단이 있다고 하자.
표본: 이 모집단에서 크기 nn의 표본을 여러 번 추출하여 각 표본의 평균을 계산한다고 하자.
중심극한정리는 다음과 같이 말한다:
표본 크기 nn이 충분히 크다면, 표본 평균의 분포는 원래 모집단의 분포가 정규분포인지 아닌지에 관계없이 정규분포에 근접하게 된다.
이 정규분포의 평균은 μ μ이고, 표준편차(표준오차)는 σ/nσ/ \sqrt{n} 이다.
즉, 표본 평균 X\overline{X}는 아래와 같은 분포를 따른다:
XN(μ,σ2n) \overline{X} \sim N \big(\mu ,\frac{ \sigma^2}{n}\big)

중심극한정리의 주요 포인트

1.
모집단의 분포와 무관:
모집단이 정규분포든 비정규분포든 관계없이, 표본 평균의 분포는 정규분포에 가까워진다.
2.
표본 크기의 중요성:
표본 크기가 커질수록, 표본 평균의 분포는 더욱 정규분포에 가까워진다.
일반적으로, n30n≥30일 때 표본 평균의 분포는 충분히 정규분포에 근접한다고 여겨지지만, 이는 보편적인 기준일 뿐 상황에 따라 다를 수 있다.
3.
표본의 표준오차:
표본 평균의 표준편차는 σ/n\sigma/\sqrt{n}로, 표본 크기가 커질수록 표본 평균의 변동성은 줄어든다.
즉, 더 큰 표본 크기에서는 표본 평균이 모집단의 평균에 더 가깝게 집중된다.

예외와 주의사항

작은 표본 크기: 표본 크기가 작을 때, 특히 n<30n<30인 경우, 모집단의 분포가 매우 비정규적이면 중심극한정리의 효과가 충분히 발휘되지 않을 수 있다.
비대칭 분포: 모집단이 극도로 비대칭적이거나 꼬리가 긴 분포라면, 표본 크기가 매우 커야(예: n>50n>50 또는 더 큼) 정규성을 얻을 수 있다.