반응형

 

수치형 변수

관측치들이 다양한 숫자 값을 가질 수 있음

 

1. 정렬을 활용한 수치형 변수의 요약

최소 값 최대 값 웅앙 값 들 관측치 들의 전반적인 위치를 확인

 

2. 합계를 활용한 수치형 변수의 요약

평균, 분산 등 관측치들의 전반적인 특성을 확인

 

3. 순서와 정렬

관측치들을 값의 크기에 따라 순서를 가짐

순서에 따라 관측치들을 정렬 가능

일반적으로 오름차순으로 정렬

 

분위수의 활용

오름차순을 기준으로 관측치를 동일한 비율로 나누는 경곗값

수치형 변수 속 관측치들의 전반적인 분포를 확인

 

1. 백분위수

관측치를 1%씩 나누는 101개의 숫자(0%, 1% --- 99%, 100%)

 

2. 사분위수

관측치를 25%씩 나누는 5개 숫자(0%, 25%, 50%, 75%, 100%)

 

사분위수와 다섯 숫자 요약

사분위수(5개의 숫자) 계산하는 요약

수치형 변수를 정렬하고 순서를 활용해서 값을 계산

  1. 0% : 최소 값(Minimum)
  2. 25% : Q1(1st Quartile)
  3. 50% : 중앙값(Median)
  4. 75% : Q3(1st Quartile)
  5. 100% : 최대 값(Maximum)

 

상자 그림을 활용한 시각화

상자 그림(Box Plot)

  • 사분위수를 표현한 그림
  • 4개 구간(0%~25%, 25%~50%, 50~75%, 75~100%) 길이 차이를 확인
  • 수치형 변수의 전반적인 분포를 확인

 

도수분포표(Frequency Table)

수치형 변수를 적절한 구간 값을 활용하여 구간화

각 구간의 관측치 수를 정리한 표

수치형 변수에서 관측치 분포를 확인

 

히스토그램(Histogram)

도수분포표를 높이로 표현한 그림

각 구간의 비중을 확인

 

상자 그림과 히스토그램의 활용

 

1. 히스토그램

수치형 변수의 분포를 확인할 때 주로 활용

2개 그룹의 히스토그램을 겹쳐 그려서 비교 가능

2. 상자그림

3개 이상의 그룹의 비교에서 전반적인 분포 비교에 활용

그룹의 개수와 상관없이 상자 그림을 나란하게 그려서 표현

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기