공부하는 블로그

[통계학의 이해Ⅰ] 6주차 조건부 확률 -1. 확률의 정리 본문

통계/통계학의 이해Ⅰ

[통계학의 이해Ⅰ] 6주차 조건부 확률 -1. 확률의 정리

young_o-o 2024. 1. 22. 21:11
728x90

해당 글은 숙명여자대학교 여인권 교수님의

K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.

추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다.

K-MOOC 사이트 링크 공유합니다.


학습목표

  • 확률의 공리를 기반으로 확률에 대한 기본정리(theorem)을 유도하고 예제를 통해 어떻게 응용될 수 있는지 알아본다.

공리적 확률 (Probability Axioms)

  • 확률이론이나 통계이론을 유도하는데 있어 고전적 정의나 빈도학파적 정의로는 일반적인 확률의 이론을 도출하는 데 한계가 있다.
  • 1993년 콜모고로프 (A. N. Kolmogorov, 1903-1987)가 확률의 공리를 발표하면서 확률이론이 체계를 이루게 된다.
  • 표본공간상에서 아래의 공리를 만족하는 P()를 확률측도(probability measure)라고 하고 P(A)르 사건 A의 확률이라고 한다.

통계학의 이해Ⅰ 강의 자료 6-1의 페이지1

공리(axiom)란 증명할 수 없으나 옳다고 판단되는 명제

  1. 공리1은 어떤 실험의 결과는 표본공간 Ω에서 항상 일어남을 뜻한다.
  2. 공리2는 어느 사건도 확률이 음수가 될 수 없으며 1보다 클 수도 없음을 뜻한다.
  3. 공리3은 서로 배반사건인 두 서건 A와 B에 대해 합사건의 확률은 각각의 확률의 합과 같음을 의미한다.

확률의 기본정리

공리로부터 확률의 기본적인 성질을 설명할 수 있다.

통계학 기본개념과 원리 제 2판 p105
통계학의 이해Ⅰ 강의 자료 6-1의 페이지2

  • 첫 번째 성질은 A여집합의 확률은 1-A의 확률이라는 것이다. (반대도 적용)
  • 해당 성질은 Ω = A ∪ A^c이며 A와 A여집합은 상호 배반이므로 공리1과 공리 3에 의해 증명 과정이 유도된다.
  • 해당 성질을 이용하면 P(공집합) = 0 인 것을 쉽게 알 수 있다. (표본공간의 여집합은 공집합인 것)

예제

  • 생일문제
    • k명 중 적어도 두 사람 이상이 생일이 같을 확률
    • A = k명의 사람이 모두 다른 생일을 가지는 사건
      • 해당 A사건의 여사건이 적어도 두 사람 이상이 생일이 같을 확률인 것이다.
      • 두 사람 이상 생일이 같을 확률은 두 사람, 세 사람... 이렇게 구해서 계산이 복잡해 지는데, 여사건을 이용하면 쉽게 풀 수 있다.
  • 100장 중 4장이 당첨 복권
    • 4장의 복권을 구입했을 때, 적어도 한 장 이상의 당첨복권을 구입하게 될 확률?
    • A: 한 장 이상의 당첨복권을 구입할 사건
      • 당첨복권이 한 장, 두 장, 세 장, 네 장인 경우 
      • A^c: 구입한 4장 모두 당첨되지 않을 사건 

통계학의 이해Ⅰ 강의 자료 6-1의 페이지3
통계학의 이해Ⅰ 강의 자료 6-1의 페이지4

  • 두 번째 성질은 사건 A가 사건 B의 부분사건이면 P(A) ≤ P(B) 이다.
  • 벤다이어그램에 의해 B = A ∪ (B ∩ A^c) 로 표현할 수 있고, A와  (B ∩ A^c) 는 서로 배반사건이기 때문에 공리 3에 의하여 더하기로  표시할 수 있다.
  • 공리2에 의해   (B ∩ A^c)  ≥ 0 이므로 P(A) ≤ P(B)가 성립된다.

통계학의 이해Ⅰ 강의 자료 6-1의 페이지5

  • 세 번째 성질은 P(A ∪ B) = P(A) + P(B) - P(A ∩ B) 이다.
  • 공리 3은 A와 B가 서로 배반사건인 경우에 적용되는 것이고, 일반적인 경우에는 위 처럼 A와 B의 교집합이 공집합이 아닌 경우가 있다. 
  • 위 상황에서 A와 B에 대하여 각각 아래처럼 변형시킬 수 있다. (아래는 A만)

통계학 기본개념과 원리 제 2판 p107
통계학 기본개념과 원리 제 2판 p107

  • 벤다이어그램 상에서 A와 B의 합사건은 아래처럼 표시할 수 있다.

통계학 기본개념과 원리 제 2판 p107

  • 합사건으로 표현된 식에 각각 P(A ∩ B^c)와 P(A^c ∩ B)에 A와 B에 대해 유도한 식을 대입하면 세 번째 성질이 성립된다.

통계학 기본개념과 원리 제 2판 p107

  • 또한 사건이 3개, A, B, C라면 아래처럼 식이 성립된다.

통계학의 이해Ⅰ 강의 자료 6-1의 페이지6

  • 즉 n개의 사건에 대해서는 일반화식을 유도할 수 있다.

통계학의 이해Ⅰ 강의 자료 6-1의 페이지7
통계학의 이해Ⅰ 강의 자료 6-1의 페이지8

  • 네 번째 성질은 P(A ∪ B) ≤ P(A) + P(B) 이다.
  • 세 번째 성질에서  P(A ∩ B) 가 항상 0보다 크기 때문에  P(A ∪ B) ≤ P(A) + P(B) 가 성립된다.
  • 네 번째 성질은 3개인 경우에도 마찬가지로  P(A ∪ B ∪  C) ≤ P(A) + P(B) + P(C)도 성립된다.

부울 부등식(Boole's inequality)

  • 또한 네 번째 성질은 P(A^c ∪ B^c) ≤ P(A^c) + P(B^c)도 성립된다는 것을 의미한다.
  • 여기에 드모르간 법칙을 적용하면,

통계학 기본개념과 원리 제 2판 p109

  • 위와 같이 정리할 수 잇으며 최종적으로 아래와 같은 부등식을 얻을 수 있다.

통계학 기본개념과 원리 제 2판 p109

  • 이에 대하여 수학적 귀납법을 이용하여 확률의 기본 성질 네 번째를 일반화 하면 n개에 사건에 대하여 아래 식이 나온다.

통계학 기본개념과 원리 제 2판 p109

  • 해당 부등식을 부울 부등식이라고 하며, 이 부등식을 이용하면 합사건에 대한 확률의 상한값을 얻을 수 있다.

본페로니 부등식(Bonferroni's inequality)

  • 부울 부등식에서 A_i를 A_i^c로 대체하면 아래 식을 유도할 수 있다.

통계학의 이해Ⅰ 강의 자료 6-1의 페이지8

  • 이 부등식을 본페로니 부등식이라고 하는데, 해당 부등식을 통해 교사건의 하한값을 얻을 수 있다. 추후 배울 분산분석에 이용된다.

요약

통계학의 이해Ⅰ 강의 자료 6-1의 페이지10
  • 해당 확률의 기본적인 성질을 증명하는 과정을 배웠다.
  • 그 중에서 1번과 3번은 매우 자주 사용하는 성질이다.
  • 4번 성질에 의해서 P(A ∩ B) ≥ P(A) + P(B) -1이 유도되는 것도 알 수 있다.