공부하는 블로그
[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -4. 확률변수의 기댓값 본문
728x90
해당 글은 숙명여자대학교 여인권 교수님의
K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.
추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.
학습목표
- 확률변수의 기댓값에 대해 알아본다.
기댓값(expectation, expected value)
- 표본평균
- {1, 2, 3, 4, 5, 6}으로 이루어진 모집단으로부터 5개의 표본을 무작위로 선택 : 1, 1, 2, 5, 6
- 관측된 값에 자료 중 그 값이 차지하는 비율을 곱하여 더한 것으로 표시
- pi는 i번째 값을 갖는 표본이 전체에서 몇 개나 차지하는지에 대한 비율
- n이 계속 커진다는 것은 표본을 계속 추출한다는 것이다.
- 통계적 확률에서 상대도수의 극한을 설명할 때 표본을 계속 추출하면 표본이 점점 커지면서 모집단의 형태가 되고, 이 것이 확률이라고 하였음
- 표본크기 n을 계속 크게하면 통계적 확률의 관점에서 볼 때 표본들은 모집단으로, 표본비율 pi는 확률질량함수 f(xi)로, 표본평균은 모평균으로 수렴할 것이다.
- x에 각각의 확률을 곱한 뒤 모두 합해주는 것인데, 이를 모평균(population mean)이라고 하며 μ (mu)라고 표기
확률변수의 기댓값(expected value)
- 확률변수에 대해 평균적으로 기대하는 값 = 모평균
- 학률분포 (또는 모집단)의 무게중심
- 이산확률변수인 경우 확률질량함수와 x를 모두 곱하여 더한다.
- f(x)는 밀도(밀도함수의 높이)이고 dx는 단위 길이이다. 따라서 f(x)와 dx를 곱하면 x근처에서의 확률이 되는 것읻.
- 따라서 x에 이 확률을 곱하여 integral한 형태가 연속확률변수의 기댓값이다.
예제
변환된 변수의 기댓값
- 변환된 학률변수의 분포를 유도한 것처럼 X제곱의 성질을 알고 싶을 때
- W의 기댓값은 마찬가지로 W가 가질 수 있는 값에 그것의 확률을 곱해서 다 더한 것
- X의 관점으로 본다면 x의 제곱 곱하기 x의 확률을 곱하여 전부 더하는 것이다.
- 여러 값을 가질 수 있는 1일때에도 -1일과 1로 풀어서 각각 제곱한것과 각각의 확률을 곱하여 더하면 된다.
- 따라서 확률변수의 기댓값은 해당 함수를 그대로 넣어주는 것으로 g(x)로 표현하면 된다.
기댓값의 성질
- 임의의 상수 a일 경우 x대신 a를 넣으면 되는 것이고, 확률질량함수의 합은 1이기 때문에 그냥 a가 된다.
- 어떤 확률변수의 선형 형태의 기댓값은 기댓값의 선형 형태로 표현할 수 있다.
3. 확률변수 X의 여러 식에 대한 더하기나 빼기의 기댓값은 이들 식의 기댓값을 더하거나 뺀 값으로 표시할 수 있다.
- 위 성질들을 이용하여 대입해서 문제를 풀 수 있다.
요약
- 모평균은 모집단의 평균이며 확률면수 X의 기댓값이다.
- 기댓값은 각각의 값에 학률을 곱하거나 연속형인 경우 그 값에 dx를 곱하여 다 더한 것이다.
- 변환된 확률변수의 기댓값은 변환된 분포를 유도할 필요 없이 확률분포에 가질 수 있는 값들을 곱하여 더한다.
- 임의의 상수 a와 b에 대해 선형 형태로 나타나는 기댓값은 기댓값의 선형형태로 표현 가능하다.
- 임의의 함수 g와 h에 대하여 두 함수의 합 혹은 차는 각각의 기댓값의 합 또는 차로 표현 가능하다.
'통계 > 통계학의 이해Ⅰ' 카테고리의 다른 글
[통계학의 이해Ⅰ] 8주차 확률벡터 -1. 분산과 표준편차 (0) | 2024.02.05 |
---|---|
[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -5. 확률분포 퀴즈 (0) | 2024.02.04 |
[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -3. 연속확률변수와 확률밀도함수 (0) | 2024.02.02 |
[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -2. 이산확률변수와 확률질량함수 (0) | 2024.02.02 |
[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -1. 확률변수란 (0) | 2024.02.02 |