728x90
반응형

지도 학습(Supervised Learning)

입력 데이터 (X)와 타깃 값(Y)을 알고 있는 데이터를 학습하여 이들의 관계를 모델링하는 학습 방법

새로운 데이터에 대한 타킷값을 예측하는 데에 사용

 

예를 들어서 컴퓨터가 개와 고양이를 분류하는 법을 가르치기 위해서 필요한다면

개, 고양이 사진을 표현한 데이터 : X

개, 고양이 사진의 클래스 : Y

이라고 할때 F(모델)을 개라고 정할 때 학습 알고리즘을 통해서 공부를 하게 되어서 컴퓨터가 인식을 한다는 것이다.

 

지도 학습(Supervised Learning)의 Y 형태에 따라서 두 가지로 나눈다.

 

분류(Claaification)

타깃변수 Y가 특정한 값만 가질 수 있는 변수인 이산형 변수 인경우

독립변수 종속변수 모델
차량 운행시간 연료소비량 차량 운행시간과 그때의 연료소비량을 분석. (운전자의 특성이 고려되어야함 예: 브레이크 횟수 등)
비만도 운동량, 음식 섭취량 매일매일 운동량과 음식 섭취량에 따른 몸무게 변화량을 기록한다,
전기사용 시간 누진세 전기사용 시간에 따라 누진세 증감
놀이동산 바이킹 대기자 수 대기 시간 대기자 1명당 대기 시간을 기록한다.
데시벨 집중하는 시간 주변 데시벨에 따라 사람들이 한가지 일에 얼마나 집중할 수 있는 지에 대해 알아볼 수 있다.
거래처수 업무용김치 주문량 거래처수 증가에 따른 업무용김치의 판매량 증가를 보고, 주문량을 확정한다.
먹은 치킨 수 몸무게 개인별로 먹은 치킨 수를 입력받고 몸무게의 변화를 기록한다.
부모의 재산 자식의 월급 부모의 재산/월급을 측정하고 자식의 월급을 측정함
집중의 강도 학습 효율성 눈을 깜빡이는 횟수 / 시험 결과

 

회귀(Regression)

타깃 변수 Y가 연속 범위 내에서 임의의 값을 가질 수 있는 변수 인 연속형 변수

독립변수 종속변수 모델
소득, 소유부동산, 금융거래액, 자동차 소유여부 등 등 복지급여 대상 여부 국세청, 국토부, 금융결제원 등에서 데이터 수집(공공데이터 요청)
오렌지의 당도 고당도 소비자마다 달다고 느끼는 당도를 조사한다
몸무게에 따른 체지방량 과체중, 비만, 저체중, 정상 등 몸무게에 따른 체지방량을 통해 과체중인지 비만인지 정상인지를 알 수 있다.
나이, 본인 병력, 가족 병력 암 보험 가입 가능 여부 나이, 본인 병력, 가족 병력을 입력 받고 암 보험 가입 가능 여부를 확인한다.
주화의 발행년도, 발행량, 상태 주화의 가격을 매김 주화가 언제 발행되었으며, 주화 발행량은 얼마나 했는지 또 주화의 상태는 얼마나 깨끗한지에 따라 주화의 가격을 책정한다.
라면 끓이는 시간 면의 익은 정도 라면을 끓이는 시간에 따른 면의 익은 정도를 계산한다.
열, 기침, 근육통 코로나19 양성/음성 열이 37.5이상이고 기침,근육통 증상이 있다면 양성, 없다면 음성으로 판단될 수 있다.
번역한 페이지 수, 언어 수입 다른 나라의 언어로 쓰여진 책이나 논문 같은 글을 번역하는데 받을 수 있는 수입을 페이지 수와 언어 등으로 분류한다.
카드 이용 금액 회원 등급 회원의 카드 이용 금액을 토대로 등급을 부여한다.

 

 

 

 

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기