머신 러닝의 분류

머신 러닝에는 현재 지도학습, 비지도학습, 자기 지도 학습, 강화 학습 4개의 커다란 범주가 있다.

            1. 지도학습

기존에 했던 이진 분류, 다중 분류, 스칼라 회귀 같이 샘플 데이터와 사람이 제시한 타깃에 매핑하는 방식의 학습 방법이다.

즉, 사람이 데이터와 정답을 모두 제시하여 이런 경우에는 이게 맞다고 하며 직접 지도하는 방식인 것이다.

이 학습 방법이 네가지 중에 머신 러닝에서  (특히 딥러닝) 가장 흔한 학습 방식으로 쓰이고 있다.

이진 분류, 다중 분류, 스칼라 회귀 외에도 문자 판독, 음성인식, 이미지 분류,

시퀀스 생성, 구문트리 예측, 물체 감지, 이미지 분할 등이 있다.

아래 그림은 물체 감지의 예로 사진에서 색깔의 경계 상자로 표시하며 내용이 무엇인지 표시하고 있다.

 

            2. 비지도 학습

비지도 학습은 어떤 타깃도 제공하지 않고 데이터에 대한 흥미로운 변환을 찾는 학습 방식이다.

예로는 군집 (데이터 셋의 특징을 찾아 분류), 이상탐지,

연상 (쇼핑 카트에 담은 물건과 비슷한 것 추천), 차원 축소 등이 있다.

지도학습에서 여러 특징 중에 학습이 잘 되는 특징을 골라야 하거나

특징이 무엇무엇이 있는지 찾아야 할 때 비지도 학습을 먼저 거치기도 한다.

구글 뉴스도 수 많은 기사들을 보고 분석하여 같은 주제를 가진 기사들을 하나의 무리로 만들어 함께 보이게끔 한다고 한다.

 

            3. 자기 지도 학습

지도학습의 특별한 경우로서 사람이 만든 타깃을 사용하지 않고 입력 데이터로 부터 타깃을 얻어 학습하는 방식이다.

예를들어 오토 인코더가 있는데,

여러 원본 영상을 입력 데이터로 주면 지난 프레임을 미루어 비슷한 방식이 올 것으로 생각하여

다음 프레임을 예측하는 것이다. 또한 비슷한 방식으로 이전 단어가 주어 졌을 때 다음 단어를 예측할 수도 있다.

 

            4. 강화 학습

환경에 대한 정보를 받고 Agent(기계)가 어떤 행동을 하여 그에 따른 보상을 최대로 하는 강화 학습 방법도 있다.

구글 딥마인드가 아타리 게임 플레이를 학습하는데 성공한 사례가 있지만

아직은 게임 외에는 명확한 성공 사례가 없다. (현재까지는)

시도하고 있는 분야로는 자율 주행차, 자원 관리, 교육 등이 있다.

매커니즘은 아래와 같다.

댓글 남기기