공부하는 블로그
[통계학의 이해Ⅰ] 10주차 주요 이산확률분포 Ⅱ-4. 확률분포 실습 본문
728x90
해당 글은 숙명여자대학교 여인권 교수님의
K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.
R을 이용한 확률분포
과제
1. 일란성 쌍둥이 확률에 대한 예제
1) 일란성 쌍둥이가 나올 확률이 0.003 정도 된다고 할 때,
무작위로 500명을 선택할 경우 그 500명 중 일란성 쌍둥이가 한 명도 없을 확률이 얼마나 될까요?
- R을 사용해서 계산하고 어떤 분포로 설명할 것인지 생각해보세요.
- 이항분포를 사용하여 설명할 것이다.
n <- 500
p <- 0.003
k <- 0
pbinom(0, size = n, prob = p)
> pbinom(0, size = n, prob = p)
[1] 0.2226277
- 5명 이상일 확률을 정확한 분포를 이용해서 계산해보고,
근사분포를 이용해서 확률을 계산해보시기 바랍니다.
- 정확한 분포는 이항분포, 근사분포는 포아송분포이다.
n <- 500
p <- 0.003
k <- 5
# 5명 이상일 확률 이항분포
pbinom(k - 1, size = n, prob = p, lower.tail=F)
# 5명 이상일 확률 포아송분포
Lambda <- n*p
ppois(k-1,Lambda,lower.tail=F)
> # 5명 이상일 확률 이항분포
> pbinom(k - 1, size = n, prob = p, lower.tail=F)
[1] 0.01839942
>
> # 5명 이상일 확률 포아송분포
> Lambda <- n*p
> ppois(k-1,Lambda,lower.tail=F)
[1] 0.01857594
2) 일란성 쌍둥이가 r번 뽑힐 때까지 표본을 무작위로 뽑는 실험을 1000번 반복하는 상황입니다.
r이 1인 경우, 쌍둥이가 나올 때까지 1000번을 반복하여 1000개의 데이터를 얻었을 때,
- 1000개의 데이터의 표본평균과 표본분산을 계산해보세요.
그리고 이 평균과 분산의 비가 얼마나 되는지 확인해보십시오.
n <- 1000
p <- 0.003
x <- rgeom(n,p)
Ex <- mean(x)
Var_X <- var(x)
Ex
Var_X
Ex/Var_X
> Ex
[1] 326.991
> Var_X
[1] 111212.2
> Ex/Var_X
[1] 0.002940245
※ 강좌는 청강한 것이라 과제 및 퀴즈 검토받지 못하였습니다. 학습한 내용 기반으로 작성한 것이므로 정답인지 아닌지 알 수 없습니다.
'통계 > 통계학의 이해Ⅰ' 카테고리의 다른 글
[통계학의 이해Ⅰ] 11주차 정규분포 -2. 정규분포의 성질 (0) | 2024.02.20 |
---|---|
[통계학의 이해Ⅰ] 11주차 정규분포 -1. 정규분포와 확률계산 (0) | 2024.02.20 |
[통계학의 이해Ⅰ] 10주차 주요 이산확률분포 Ⅱ-3. 다항분포 (0) | 2024.02.19 |
[통계학의 이해Ⅰ] 10주차 주요 이산확률분포 Ⅱ-2. 음이항분포 (0) | 2024.02.18 |
[통계학의 이해Ⅰ] 10주차 주요 이산확률분포 Ⅱ-1. 포아송분포 (3) | 2024.02.17 |