728x90
반응형
기술통계
수집한 자료를 분석하여 대상들의 속성을 파악하는 통계방법
1) 중심 경향 값 : 전체 자료를 대표할 수 있는 수치들
- 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 나눈 수치
- 중앙값 : 최댓값과 최솟값의 정가운데 수치
- 최빈값 : 가장 많은 빈도를 보이는 수치
2) 분산도 : 전체 자료가 얼마나 퍼져 있는 지를 알 수 있는 수치들
- 분산 : 각 자료가 평균으로부터 떨어진 거리(편차)들을 제곱한 수치들의 총합을 전체 자료의 수로 나눈 수치
- 표준편차 : 분산을 제곱근을 취한 수치
3) 상관계수 : 두 변수 간의 관계의 크기
4) 회귀 계수 : 독립변수(원인)가 종속변수(결과)에 미치는 영향의 크기
추정 통계
모집단을 대표하는 표본을 추출하고 표본의 기술통계를 이용하여 모집단의 속성들을 유추하는 통계방법
신뢰구간
- 추리통계에서 예측한 모집단의 특성이 위치할 가능성이 높은 구간
- 표본에서 구해지는 기술통계 값들을 이용하여 계산되며, 90%, 99%, 99.9% 신뢰 수준에서 달라짐
- 95% 신뢰구간보다 99% 신뢰구간 영역이 더 넓음
모집단
연구 또는 분석이 이루어지는 전체 대상
표본
모집단에서 추출한 일부로, 모집단의 속성들을 유추하는 데 사용
1) 확률 표본추출 방법 : 무작위 표본을 추출하는 방법으로 모집단을 대표할 가능성이 높은 방법
2) 비확률 표본추출 방법 : 조사자의 편의나 판단에 의해서 표본을 추출하는 방법으로 모집단을 대표하지 않을 가능성이 존재하는 방법
중심 극한 정리
표본이 30 이상으로 충분히 클 때
1) 모집단의 분포와 상관없이 표본을 정규 분포
2) 표본의 평균 = 모집단의 평균
3) 표본의 분산 = (모집단의 분산)/(표본의 수)
자유도
평균을 유지하면서 자유롭게 어떠한 값도 가질 수 있는 사례의 수 (N-1)
모집단의 평균 = 3이라면 4개를 추출해서
(X1 + X2 + X3 + X4) / 4 = 3
728x90
반응형
'데이터분석 > 기초' 카테고리의 다른 글
[데이터분석] 기초 통계 학 3 (4) | 2021.11.23 |
---|---|
[데이터분석] 기초 통계 학 2 (0) | 2021.11.22 |
[데이터분석] 헬스케어 / 제약 / 기타 데이터 활용 (2) | 2021.11.20 |
[데이터분석] 금융 보험 데이터 활용하기 (2) | 2021.11.19 |
[데이터 분석] 제조업 통신/마케팅 데이터 활용하기 (4) | 2021.11.18 |
최근댓글