공부하는 블로그

[통계학의 이해Ⅰ] 11주차 정규분포 -3. 확률표본과 통계량 본문

통계/통계학의 이해Ⅰ

[통계학의 이해Ⅰ] 11주차 정규분포 -3. 확률표본과 통계량

young_o-o 2024. 2. 21. 00:43
728x90

해당 글은 숙명여자대학교 여인권 교수님의

K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.

추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.

K-MOOC 사이트 링크 공유합니다.


학습목표

  • 확률표본이 무엇인지 알아보고 이를 이용하여 만든 통계량의 통계적 성질을 유도해본다.

확률표본(random sample)

  • 모집단에서 무작위로 선택되어진 관측값
  • 서로 독립이고 동일한 분포를 따른다고 가정
    • independent and identically distributed (iid)
    • 독립, 동일한 분포 → 복원추출
    • 예) 정규분포에서 추출한 경우

통계학의 이해Ⅰ 강의 자료 11-3 페이지1

  • 독립이기 때문에 결합분포는 각각의 주변분포 곱으로 표시

통계학의 이해Ⅰ 강의 자료 11-3 페이지2

  • 동일한 분포를 따르기 때문에 동일한 확률질량(밀도)함수를 가짐
    • 동일한 분포를 따른다는 것은 Xi가 i에 관계없이 모두 같은 형태라는 것

통계학의 이해Ⅰ 강의 자료 11-3 페이지2
통계학의 이해Ⅰ 강의 자료 11-3 페이지2

  • 따라서 결합분포는 위와 같이 표기 가능

예제

윷놀이

통계학의 이해Ⅰ 강의 자료 11-3 페이지3

통계학적 관점에서 표본을 뽑는 이유

  • 모집단에 대한 추론

통계학의 이해Ⅰ 강의 자료 11-3 페이지4

  • 모집단에서 n개의 확률표본을 얻는다고 할 때,
    • μ, σ^2이 무엇인가? → 모수적 추론
      • 모집단의 성질을 모수에 대해 알아보면서 해결하는 것
    • μ에 대해 알아보기 위해서는 X bar
    • σ^2에 대해 알아보기 위해서는 S^2
  • 통계량 (statistic): 관측가능한 표본의 함수
    • 관측가능하다는 것은 미지의 모수를 포함하지 않음을 의미
    • 관측가능하다는 것은 자료를 이용하여 계산할 수 있다는 것
  • 기술통계에서는 x bar와 s^2, 즉 표본평균과 표본분산을 계산, 이는 궁극적으로 모집단의 평균과 분산에 관심이 있기 때문
  • x bar와 s^2에 대한 성질을 알아보고자 하고 이론적인 설명을 위해 "통계량" 이라고 명칭
  • 추정량(estimator): 모수의 추정에서 사용되는 통계량
    • 확률변수
    • 추정값(estimate, 추정치): 추정량의 관측값

통계학의 이해Ⅰ 강의 자료 11-3 페이지5

  • 대문자로 표현하면 확률변수, 소문자로 표현하면 어떠한 상수값
  • 추출하기 전에 확률변수로 하는 것을 추정량, 이미 추출하여 변하지 않는 값으로 하는 것을 추정값이라고 함

확률분포가 다음과 같을 때

통계학의 이해Ⅰ 강의 자료 11-3 페이지6

  • 두 개의 확률표본 추출: X1, X2
    • X1과 X2는 서로 독립이다.
    • Y = max(X1, X2)일 때, Y의 분포는?

통계학의 이해Ⅰ 강의 자료 11-3 페이지6

  • Y의 경우 X1과 X2를 뽑아서 max를 구하는 것, 계속 구하면 0의 값은 4/25로 수렴하고 나머지도 마찬가지
  • 이렇게 뽑은 y들은 모집단의 분포
  • 이것은 통계량의 확률분포, 표집분포이다.
    • 통계량의 확률분포 → 표집분포 (sampling distribution)

요약

  • 통계량은 관측가능한 표본의 함수이다.
  • 추정량은 모수의 추정에서 사용되는 통계량이다.
  • 추정값은 추정량의 관측값이다.
  • 임의의 통계량에 대한 확률분포를 표집분포라고 한다.
    • 표집분포는 모집단의 분포이다.