공부하는 블로그

[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -4. 확률변수의 기댓값 본문

통계/통계학의 이해Ⅰ

[통계학의 이해Ⅰ] 7주차 확률변수와 확률분포 -4. 확률변수의 기댓값

young_o-o 2024. 2. 2. 21:56
728x90

해당 글은 숙명여자대학교 여인권 교수님의

K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.

추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.

K-MOOC 사이트 링크 공유합니다.


학습목표

  • 확률변수의 기댓값에 대해 알아본다.

기댓값(expectation, expected value)

  • 표본평균
    • {1, 2, 3, 4, 5, 6}으로 이루어진 모집단으로부터 5개의 표본을 무작위로 선택 : 1, 1, 2, 5, 6

통계학의 이해Ⅰ 강의 자료 7-4의 페이지1

  • 관측된 값에 자료 중 그 값이 차지하는 비율을 곱하여 더한 것으로 표시

통계학의 이해Ⅰ 강의 자료 7-4의 페이지2

  • pi는 i번째 값을 갖는 표본이 전체에서 몇 개나 차지하는지에 대한 비율
  • n이 계속 커진다는 것은 표본을 계속 추출한다는 것이다.
  • 통계적 확률에서 상대도수의 극한을 설명할 때 표본을 계속 추출하면 표본이 점점 커지면서 모집단의 형태가 되고, 이 것이 확률이라고 하였음
  • 표본크기 n을 계속 크게하면 통계적 확률의 관점에서 볼 때 표본들은 모집단으로, 표본비율 pi는 확률질량함수 f(xi)로, 표본평균은 모평균으로 수렴할 것이다.
  • x에 각각의 확률을 곱한 뒤 모두 합해주는 것인데, 이를 모평균(population mean)이라고 하며 μ (mu)라고 표기

확률변수의 기댓값(expected value)

  • 확률변수에 대해 평균적으로 기대하는 값 = 모평균
  • 학률분포 (또는 모집단)의 무게중심

통계학의 이해Ⅰ 강의 자료 7-4의 페이지3

  • 이산확률변수인 경우 확률질량함수와 x를 모두 곱하여 더한다.

통계학의 이해Ⅰ 강의 자료 7-4의 페이지4

  • f(x)는 밀도(밀도함수의 높이)이고 dx는 단위 길이이다. 따라서 f(x)와 dx를 곱하면 x근처에서의 확률이 되는 것읻.
  • 따라서 x에 이 확률을 곱하여 integral한 형태가 연속확률변수의 기댓값이다.

예제

통계학의 이해Ⅰ 강의 자료 7-4의 페이지5
통계학의 이해Ⅰ 강의 자료 7-4의 페이지6
통계학의 이해Ⅰ 강의 자료 7-4의 페이지6

변환된 변수의 기댓값

통계학의 이해Ⅰ 강의 자료 7-4의 페이지7

  • 변환된 학률변수의 분포를 유도한 것처럼 X제곱의 성질을 알고 싶을 때

통계학의 이해Ⅰ 강의 자료 7-4의 페이지8

  • W의 기댓값은 마찬가지로  W가 가질 수 있는 값에 그것의 확률을 곱해서 다 더한 것
  • X의 관점으로 본다면 x의 제곱 곱하기 x의 확률을 곱하여 전부 더하는 것이다.
  • 여러 값을 가질 수 있는 1일때에도 -1일과 1로 풀어서 각각 제곱한것과 각각의 확률을 곱하여 더하면 된다.

통계학의 이해Ⅰ 강의 자료 7-4의 페이지9

  • 따라서 확률변수의 기댓값은 해당 함수를 그대로 넣어주는 것으로 g(x)로 표현하면 된다.

기댓값의 성질

통계학의 이해Ⅰ 강의 자료 7-4의 페이지10

  1. 임의의 상수 a일 경우 x대신 a를 넣으면 되는 것이고, 확률질량함수의 합은 1이기 때문에 그냥 a가 된다.
  2. 어떤 확률변수의 선형 형태의 기댓값은 기댓값의 선형 형태로 표현할 수 있다.

통계학의 이해Ⅰ 강의 자료 7-4의 페이지11

3. 확률변수 X의 여러 식에 대한 더하기나 빼기의 기댓값은 이들 식의 기댓값을 더하거나 뺀 값으로 표시할 수 있다.

 

통계학의 이해Ⅰ 강의 자료 7-4의 페이지12

  • 위 성질들을 이용하여 대입해서 문제를 풀 수 있다.

요약

통계학의 이해Ⅰ 강의 자료 7-4의 페이지13
  • 모평균은 모집단의 평균이며 확률면수 X의 기댓값이다.
  • 기댓값은 각각의 값에 학률을 곱하거나 연속형인 경우 그 값에 dx를 곱하여 다 더한 것이다.
  • 변환된 확률변수의 기댓값은 변환된 분포를 유도할 필요 없이 확률분포에 가질 수 있는 값들을 곱하여 더한다.
  • 임의의 상수 a와 b에 대해 선형 형태로 나타나는 기댓값은 기댓값의 선형형태로 표현 가능하다.
  • 임의의 함수 g와 h에 대하여 두 함수의 합 혹은 차는 각각의 기댓값의 합 또는 차로 표현 가능하다.