공부하는 블로그
[통계학의 이해Ⅰ] 9주차 주요 이산확률분포 Ⅰ-1. 베르누이 시행과 확률변수 본문
728x90
해당 글은 숙명여자대학교 여인권 교수님의
K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.
추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.
학습목표
- 대표적인 이산분포인 이항분포의 기초를 이루는 베르누이 시행과 베르누이 확률변수에 대해 알아본다.
베르누이 시행(Bernoulli trial)
- 각 실험에서 발생 가능한 결과는 단 2가지
- 예) (성공, 실패), (앞면, 뒷면)
- 각 실험이 독립적으로 수행
- 모든 실험에서 결과의 확률은 항상 동일
- 성공 또는 실패의 두 가지 결과가 발생하는 실험을 독립적으로 시행하는데 매 시행에서 성공할 확률이 동일한 경우 베르누이 시행(Bernoulli trial) 이라고 한다.
예제
불량품 검사
- 10개의 제품 중 3개가 불량품
- 2개를 복원추출하는 경우 → 베르누이 시행
- 해당 경우는 발생가능한 결과는 성공과 실패 두 가지이며, 매 실험이 독립적이기 때문에 베르누이 시행
- 독립을 확인하는 방법은 교집합이 각각의 확률의 곱으로 표현되는 것으로 확인
- 2개를 비복원추출하는 경우 → 독립?
- 비복원추출의 경우 두 번째 추출이 첫 번째 추출 결과에 영향을 받기 때문에 베르누이 시행이라 할 수 없음
- 10000개의 제품 중 3000개가 불량품 (모집단의 크기가 커짐)
- 2개를 복원추출하는 경우 → 베르누이 시행
- 2개를 비복원추출하는 경우
- 두 번째 시행의 결과는 첫 번째 시행의 결과 영향을 거의 받지 않음
- 모집단의 크기가 매우 크고 이에 비해 표본의 크기가 상대적으로 작아 비복원추출의 결과와 복원추출의 결과 차이가 거의 없는 경우임
- 모집단이 크고 표본크기가 상대적으로 크지 않는 경우, 비복원 추출도 베르누이 실험을 근사모형으로 사용 가능
베르누이 확률변수
- 베르누이 시행에서 '성공'확률을 p라고 하면 '실패'확률은 1-p
- 실험결과가 실패면 0, 성공이면 1의 값을 갖는 확률변수 X의 확률분포
- P(X = 1) = P(S) = p
- P(X = 0) = P(F) = 1-p
- 일종의 지시함수(indicator function)
- 이러한 확률분포를 따르는 확률변수를 베르누이 확률변수(Bernoulli random variable)이라함
- 베르누이 분포(Bernoulli distribution)를 따른다고 함
- 성공확률이 p인 베르누이 확률질량함수는 아래와 같이 표기함
- X ~ B(p)로 표기
베르누이 분포의 기댓값과 분산
- 기댓값은 다 곱하고 더하는 것이기 때문에 p가 됨
- 제곱의 기댓값도 마찬가지로 p가 됨
- 분산의 경우 X제곱의 기댓값 - X의 기댓값의 제곱이기 때문에 p(1-p)가 됨
- 확률 p가 0 또는 1에 가까울수록 분산은 작아지며 p가 1/2일 때 분산은 1/4로 가장 큰 값을 갖게 된다.
- 표준편차는 루트를 취한 것
- 베르누이 분포의 평균은 성공할 확률 p이고, 분산은 평균 p에 영향을 받는다.
- 베르누이 확률분포는 성공확률인 p에 의해 확률과 기댓값이 결정됨
- 분포의 특성을 경정하는 상수를 모수(parameter)라고 하며 '성공확률이 p인' 대신 '모수가 p인' 베르누이 분포라고도 함
요약
- 성공 또는 실패의 두 가지 결과가 발생하는 실험을 독립적으로 시행하는데 매 시행에서 성공할 확률이 동일한 경우 베르누이 시행
- 모집단이 크고 표본크기가 상대적으로 크지 않는 경우, 비복원 추출도 베르누이 실험을 근사모형으로 사용 가능
- 베르누이 분포의 평균은 성공할 확률이며 분산은 평균에 영향을 받음
'통계 > 통계학의 이해Ⅰ' 카테고리의 다른 글
[통계학의 이해Ⅰ] 9주차 주요 이산확률분포 Ⅰ-3. 초기하분포 (2) | 2024.02.13 |
---|---|
[통계학의 이해Ⅰ] 9주차 주요 이산확률분포 Ⅰ-2. 이항분포 (2) | 2024.02.12 |
[통계학의 이해Ⅰ] 8주차 확률벡터 -4. 결합분포 퀴즈 (0) | 2024.02.11 |
[통계학의 이해Ⅰ] 8주차 확률벡터 -3. 공분산과 상관계수 (0) | 2024.02.11 |
[통계학의 이해Ⅰ] 8주차 확률벡터 -2. 결합분포와 주변분포 (0) | 2024.02.05 |