검색
색인
지도형 기계 학습, 指導型機械學習, Supervised learning
동의어 : 지도 학습
기계 학습 중 컴퓨터가 입력값과 그에 따른 출력값이 있는 데이터를 이용하여 주어진 입력에 맞는 출력을 찾는 학습 방법.
지도형 기계 학습 모델은 입력된 문제에 대한 답을 예측하는 데 사용된다. 기계 번역, 상품 추천, 질병 진단 등에 응용될 수 있다.


학습 훈련 데이터(training data)로 입력과 출력이 같이 제공되는 상황을 문제(입력)의 답(출력)을 가르쳐 주는 것에 비유하여 지도형 기계 학습(이하 '지도 학습')이라고 한다. 예로, 개와 고양이 사진을 구분하는 것을 들 수 있다. 이때 입력은 사진이고, 출력은 개 또는 고양이인지의 여부가 된다. 개인지 고양이인지의 여부가 기록된 사진을 이용해 지도 학습을 하며, 학습 결과는 훈련 데이터에 포함되지 않은 사진을 구분하는 데 적용된다.
지도 학습에서 입력을 예측 변수(predictor variable) 또는 특징(feature), 출력을 반응 변수(response variable) 또는 목표 변수(target variable)라고도 한다. 지도 학습 중 목표 변수가 수치형(numeric)인 경우는 회귀(regression), 범주형(categorical)인 경우는 분류(classification)라고 한다. 지도 학습을 위한 대표적인 기계 학습 모델로는 선형 회귀(linear regression), 로지스틱 회귀(logistic regression), 결정 트리(decision tree), 서포트 벡터 머신(support vector machine), 인공 신경망 등이 있다.

* 선형 회귀(linear regression): 지도형 기계 학습 중 출력이 수치형 값을 가지는 경우를 회귀라 하며, 회귀에 선형 함수를 이용하는 것을 선형 회귀라 한다.
* 로지스틱 회귀(logistic regression): 지도형 기계 학습 중 출력이 범주형 값을 가지는 경우를 분류라 하며, 로지스틱 회귀는 로지스틱 함수를 이용하는 분류 방법이다.
* 결정 트리(decision tree): 주어진 입력값이 특정한 값을 출력하기 위한 다양한 조건들을 트리 형태로 표현하는 방법. 회귀와 분류에 모두 사용된다.
* 서포트 벡터 머신(support vector machine): 주어진 입력이 존재하는 다차원 공간 상의 초평면(hyperplane) 개념을 이용하는 분류 방법. 입력 데이터 예제 중 초평면을 결정하는 것들을 서포트 벡터라 한다.