본문으로 바로가기

기계 학습(Machine Learning) 이란 무엇인가?

기계 학습은 문제를 해결하기 위한 맞춤 코드(custom code) 를 사용하지 않고 어떤 데이터에 대해 무선가 흥미로운 것을 알려줄 수 있는 일반적인 알고리즘( generic algorithms) 이 있다는 관점(idea) 입니다.
즉 어떤 랭귀지로 어떤 코드를 작성하는지는 상관 없습니다. 데이터를 어떻게 효율적으로 가공하고, 패턴이나 관계를 찾아 존재하지 않는 결과를 예측한다면 그 목적을 이뤘다고 볼 수 있습니다.
두 종류의 기계 학습 알고리즘이 있습니다. 


지도학습(supervised learning)비지도 학습(unsupervised learning) 


1) 지도학습( Supervised Learning)
훈련 데이터(train data)로 데이터의 관계를 알아냅니다. 당연히 train data에는 data에 따른 결과값도 포함되어 있습니다.
예를들면 타이타닉 문제( 캐글 )가 있는데 고객 정보와 생존 결과 data가 있으면 어떤 고객의 종류가 생존결과에 영향을 미치는지 학습 시켜, 고객 data만 있으면 그 사람의 생존/죽음 여부를 예측할 수 있습니다.

2) 비지도 학습(unsupervised Learning)
data의 결과를 모르는 상태, 즉 고객의 생존 여부를 모르는 상태에서 고객 data를 가지고 분류해 미처 발견하지 못한 사실을 알아냅니다.
뭐.. 나이의 분포나 가족 단위, 가족 구성원 등 을 알아낼 수 있습니다. 이런 사실들은 실제로 생존을 예측하는데 도움이 될 수 있습니다.

초창기 머신러닝 전문가들은 지도학습(supervised learning) 에 중점을 뒀고, 그 효과를 봤지만 최근엔 비지도학습(unsupervised learning) 에 관신이 높아지고 있습니다.
unsupervied learing 은 영상처리, 자율주행, 등 여러 분야에서 사용되고 있다고 합니다.
궁금해서 검색해본 내용인데, 좀 더 상세히 공부해봐야겠습니다.