공부하는 블로그

[통계학의 이해Ⅰ] 9주차 주요 이산확률분포 Ⅰ-1. 베르누이 시행과 확률변수 본문

통계/통계학의 이해Ⅰ

[통계학의 이해Ⅰ] 9주차 주요 이산확률분포 Ⅰ-1. 베르누이 시행과 확률변수

young_o-o 2024. 2. 12. 23:12
728x90

해당 글은 숙명여자대학교 여인권 교수님의

K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.

추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.

K-MOOC 사이트 링크 공유합니다.


학습목표

  • 대표적인 이산분포인 이항분포의 기초를 이루는 베르누이 시행과 베르누이 확률변수에 대해 알아본다.

베르누이 시행(Bernoulli trial)

  1. 각 실험에서 발생 가능한 결과는 단 2가지
    • 예) (성공, 실패), (앞면, 뒷면)
  2. 각 실험이 독립적으로 수행
  3. 모든 실험에서 결과의 확률은 항상 동일

통계학의 이해Ⅰ 강의 자료 9-1 페이지1

  • 성공 또는 실패의 두 가지 결과가 발생하는 실험을 독립적으로 시행하는데 매 시행에서 성공할 확률이 동일한 경우 베르누이 시행(Bernoulli trial) 이라고 한다.

예제

불량품 검사

  • 10개의 제품 중 3개가 불량품
  • 2개를 복원추출하는 경우 → 베르누이 시행
    • 해당 경우는 발생가능한 결과는 성공과 실패 두 가지이며, 매 실험이 독립적이기 때문에 베르누이 시행
    • 독립을 확인하는 방법은 교집합이 각각의 확률의 곱으로 표현되는 것으로 확인

통계학의 이해Ⅰ 강의 자료 9-1 페이지2

  • 2개를 비복원추출하는 경우 → 독립?
  • 비복원추출의 경우 두 번째 추출이 첫 번째 추출 결과에 영향을 받기 때문에 베르누이 시행이라 할 수 없음

통계학의 이해Ⅰ 강의 자료 9-1 페이지2

  • 10000개의 제품 중 3000개가 불량품 (모집단의 크기가 커짐)
    • 2개를 복원추출하는 경우 → 베르누이 시행

통계학의 이해Ⅰ 강의 자료 9-1 페이지3

  • 2개를 비복원추출하는 경우

통계학의 이해Ⅰ 강의 자료 9-1 페이지3

  • 두 번째 시행의 결과는 첫 번째 시행의 결과 영향을 거의 받지 않음
  • 모집단의 크기가 매우 크고 이에 비해 표본의 크기가 상대적으로 작아 비복원추출의 결과와 복원추출의 결과 차이가 거의 없는 경우임
  • 모집단이 크고 표본크기가 상대적으로 크지 않는 경우, 비복원 추출도 베르누이 실험을 근사모형으로 사용 가능

베르누이 확률변수

  • 베르누이 시행에서 '성공'확률을 p라고 하면 '실패'확률은 1-p
  • 실험결과가 실패면 0, 성공이면 1의 값을 갖는 확률변수 X의 확률분포
    • P(X = 1) = P(S) = p
    • P(X = 0) = P(F) = 1-p
  • 일종의 지시함수(indicator function)
  • 이러한 확률분포를 따르는 확률변수를 베르누이 확률변수(Bernoulli random variable)이라함
  • 베르누이 분포(Bernoulli distribution)를 따른다고 함
  • 성공확률이 p인 베르누이 확률질량함수는 아래와 같이 표기함

통계학 기본개념과 원리 제 2판 p175

  • X ~ B(p)로 표기

베르누이 분포의 기댓값과 분산

통계학의 이해Ⅰ 강의 자료 9-1 페이지5

  • 기댓값은 다 곱하고 더하는 것이기 때문에 p가 됨
  • 제곱의 기댓값도 마찬가지로 p가 됨
  • 분산의 경우 X제곱의 기댓값 - X의 기댓값의 제곱이기 때문에 p(1-p)가 됨
    • 확률 p가 0 또는 1에 가까울수록 분산은 작아지며 p가 1/2일 때 분산은 1/4로 가장 큰 값을 갖게 된다.
  • 표준편차는 루트를 취한 것
  • 베르누이 분포의 평균은 성공할 확률 p이고, 분산은 평균 p에 영향을 받는다.
  • 베르누이 확률분포는 성공확률인 p에 의해 확률과 기댓값이 결정됨
  • 분포의 특성을 경정하는 상수를 모수(parameter)라고 하며 '성공확률이 p인' 대신 '모수가 p인' 베르누이 분포라고도 함

요약

  • 성공 또는 실패의 두 가지 결과가 발생하는 실험을 독립적으로 시행하는데 매 시행에서 성공할 확률이 동일한 경우 베르누이 시행
  • 모집단이 크고 표본크기가 상대적으로 크지 않는 경우, 비복원 추출도 베르누이 실험을 근사모형으로 사용 가능
  • 베르누이 분포의 평균은 성공할 확률이며 분산은 평균에 영향을 받음