사건과 확률
사건 : 관측치나 데이터가 특정 조건을 만족시키는 상황
로또 1등에 당첨될 사건, 프로토에서 1등이 당첨될 사건 등
확률 : 관심 있는 사건이 발생할 가능성을 0부터 1 사이 숫자로 표현한 값
확률을 계산하는 다양한 방법
1. 경우의 수의 활용
모든 가능한 경우의 수 중에서 관심 사건에 해당하는 경우의 수의 비중을 계산
예) 동전을 2번 던져 모두 앞면이 나올 확률 계산
- 모든 가능한 경우의 수 4 , 모두 앞면이 나올 확률 : 1/4 = 0.25
예) 로또 1등에 당첨될 확률 계산
- 모든 가능한 경우의 수 6/45 = 8,145,060
- 1등 당첨 경우의 수 : 1
- 1등 당첨 확률 : 1/8,145,060 = 0.00000012
2. 모의실험
관심 사건이 일어날 가상의 상황을 반복해서 관심 확률을 계산
예) 동전을 튕겨 앞면이 나올 확률
- 동전을 한번 튕겨 나온 면을 기록
- 동일한 작업을 1천 번 반복하여 결과를 기록
- 앞면이 나올 확률 700/1000 = 0.7
3. 데이터의 활용
데이터의 전체 관측치에서 관심사건에 해당하는 관측치의 비중을 계산
예) B팀과 대결에서 A팀이 이길 확률
- A팀과 B팀의 과거 경기 확인
- 과거 전체 경기 중 A팀이 이긴 경기의 비중, 승률을 계산
더 복잡하고 다양한 확률 계산도 가능하다.
데이터 공간과 확률
데이터 공간의 구성과 확률
- 변수 수만큼 차원이 생성
- 관측치 수만큼의 점이 공간에 표현
예) 100 가족이 아빠 키와 아들 키 데이터 공간 : 2차원 100개 점
데이터 공간에서의 확률의 정의
데이터 공간 중에서 관심 있는 영역에 속하는 관측치의 비중
데이터 공간과 분포
분포 : 관측치들이 데이터 공간에 흩어져 퍼져 있는 모양
밀도 : 어떤 분포에서 특정 값이나 구간의 관측치 비중을 표현한 숫자
'데이터분석 > 기초' 카테고리의 다른 글
[데이터분석] 데이터 분석의 꽃 통계 8 (2) | 2021.12.27 |
---|---|
[데이터분석] 데이터 분석의 꽃 통계 6 (0) | 2021.12.20 |
[데이터분석] 데이터 분석의 꽃 통계 5 (0) | 2021.12.19 |
[데이터분석] 데이터 분석의 꽃 통계 4 (2) | 2021.12.18 |
[데이터분석] 데이터 분석의 꽃 통계 3 (0) | 2021.12.17 |
최근댓글