공부하는 블로그
[통계학의 이해Ⅰ] 11주차 정규분포 -3. 확률표본과 통계량 본문
728x90
해당 글은 숙명여자대학교 여인권 교수님의
K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.
추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.
학습목표
- 확률표본이 무엇인지 알아보고 이를 이용하여 만든 통계량의 통계적 성질을 유도해본다.
확률표본(random sample)
- 모집단에서 무작위로 선택되어진 관측값
- 서로 독립이고 동일한 분포를 따른다고 가정
- independent and identically distributed (iid)
- 독립, 동일한 분포 → 복원추출
- 예) 정규분포에서 추출한 경우
- 독립이기 때문에 결합분포는 각각의 주변분포 곱으로 표시
- 동일한 분포를 따르기 때문에 동일한 확률질량(밀도)함수를 가짐
- 동일한 분포를 따른다는 것은 Xi가 i에 관계없이 모두 같은 형태라는 것
- 따라서 결합분포는 위와 같이 표기 가능
예제
윷놀이
통계학적 관점에서 표본을 뽑는 이유
- 모집단에 대한 추론
- 모집단에서 n개의 확률표본을 얻는다고 할 때,
- μ, σ^2이 무엇인가? → 모수적 추론
- 모집단의 성질을 모수에 대해 알아보면서 해결하는 것
- μ에 대해 알아보기 위해서는 X bar
- σ^2에 대해 알아보기 위해서는 S^2
- μ, σ^2이 무엇인가? → 모수적 추론
- 통계량 (statistic): 관측가능한 표본의 함수
- 관측가능하다는 것은 미지의 모수를 포함하지 않음을 의미
- 관측가능하다는 것은 자료를 이용하여 계산할 수 있다는 것
- 기술통계에서는 x bar와 s^2, 즉 표본평균과 표본분산을 계산, 이는 궁극적으로 모집단의 평균과 분산에 관심이 있기 때문
- x bar와 s^2에 대한 성질을 알아보고자 하고 이론적인 설명을 위해 "통계량" 이라고 명칭
- 추정량(estimator): 모수의 추정에서 사용되는 통계량
- 확률변수
- 추정값(estimate, 추정치): 추정량의 관측값
- 대문자로 표현하면 확률변수, 소문자로 표현하면 어떠한 상수값
- 추출하기 전에 확률변수로 하는 것을 추정량, 이미 추출하여 변하지 않는 값으로 하는 것을 추정값이라고 함
확률분포가 다음과 같을 때
- 두 개의 확률표본 추출: X1, X2
- X1과 X2는 서로 독립이다.
- Y = max(X1, X2)일 때, Y의 분포는?
- Y의 경우 X1과 X2를 뽑아서 max를 구하는 것, 계속 구하면 0의 값은 4/25로 수렴하고 나머지도 마찬가지
- 이렇게 뽑은 y들은 모집단의 분포
- 이것은 통계량의 확률분포, 표집분포이다.
- 통계량의 확률분포 → 표집분포 (sampling distribution)
요약
- 통계량은 관측가능한 표본의 함수이다.
- 추정량은 모수의 추정에서 사용되는 통계량이다.
- 추정값은 추정량의 관측값이다.
- 임의의 통계량에 대한 확률분포를 표집분포라고 한다.
- 표집분포는 모집단의 분포이다.
'통계 > 통계학의 이해Ⅰ' 카테고리의 다른 글
[통계학의 이해Ⅰ] 12주차 표집분포 -1. 표본평균의 표집분포 (0) | 2024.02.21 |
---|---|
[통계학의 이해Ⅰ] 11주차 정규분포 -4. 분포계산실습 (0) | 2024.02.21 |
[통계학의 이해Ⅰ] 11주차 정규분포 -2. 정규분포의 성질 (0) | 2024.02.20 |
[통계학의 이해Ⅰ] 11주차 정규분포 -1. 정규분포와 확률계산 (0) | 2024.02.20 |
[통계학의 이해Ⅰ] 10주차 주요 이산확률분포 Ⅱ-4. 확률분포 실습 (0) | 2024.02.19 |