728x90
반응형

 

조건부 확률의 이해

조건부 확률의 표기법

  • A, B : 관심 있는 사건 A 혹은 B
  • n : 전체 관측치 수 
  • n(A) : 사건 A에 해당하는 관측치 수
  • P(A) : 관심 있는 사건 A의 확률, P(A) = n(A)/n
  • P(A|B) : B라는 조건 하에서 관심 있는 사건 A의 확률

 

조건부 확률(Conditional Probalbility)

전체 가 아닌 특정 조건을 만족하는 관측치 안에서 계산된 확률 전체 확률과 조건부 확률을 비교해서 차이를 확인

 

조건부 확률과 독립

독립(Independence) : 두 사건 A, B가 확률적으로 서로 관계가 없는 경우

 

모집단과 표본

모집단(Population)

관심 있는 대상 전체

 

표본(Sample)

- 모집단에서 추출한 관심 대상 일부

- 데이터 = 표본

 

표본과 추론 통계

추정(estimation)

데이터로 전체 모집단의 특성을 확인하는 과정

데이터의 차이를 확인

검정(test)

확인된 차이의 유의미 여부나 가설의 타당성을 판단하는 과정

 

이터의 대표성이 중요

 

데이터 요약의 한계

데이터 요약의 목적 차이와 관계를 확인

차이와 관계의 유의미 여부는 판단 불가능

 

 

귀무가설(Null Hypothesis)

모집단의 특성에 대한 차이, 관계가 없을 을 가정 비교의 기준점 역할

 

대립 가설(Alternative Hypothesis)

귀무가설과 반대로 차이, 관계가 있음을 가정

 

검정(Test)

귀무가설과 대립 가설 두 중에서 확률적으로 더 나은 쪽을 선택하는 과정

보수적으로 판단하기 위해서 귀무가설을 기준으로 판단

 

유의 확률(Significance Probability, P-Value, P-값)

귀무가설이 맞다는 가정하에 데이터 속 차이나 관계가 나올 가능성을 계산한 조건부 확률

 

유의 수준과 검정

유의 수준(significant level)

유의 확률(p-값)에 대한 판단의 기준값

  • 유의 확률이 유의 수준보다 작으면 귀무가설을 선택
  • 유의 확률이 유의 수준보다 크면 대립 가설을 선택

 

일반적으로 0.05를 활용

  • 유의 확률(p-값) ≤ 0.05 : 대립 가설(H1)을 선택
  • 유의 확률(p-값) ≥ 0.05 : 귀 모가설(H0)을 선택

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기