머신러닝이란 무엇인가?

머신러닝이란 무엇인가?

2020. 3. 3. 22:17ㆍComputer Science/Machine Learning💻

최근 파란학기를 시작하게 되면서 앱개발을 하게 되었는데

앱에 들어갈 다양한 기능 중에 챗봇이 맘에 들어서 알아보게 되었다.

미국에 있을 땐 CNN모델을 가지고 이미지 모델링을 하는걸 배웠었는데,

챗봇의 경우 자연어 처리를 해야해서 CNN이 아닌 RNN모델을 사용하는 것을 알 수 있었다.

마침 머신러닝을 제대로 공부해보고 싶기도 하고,,,기초부터 다시 다지고 싶어서

유튜브를 여기저기 뒤진 결과 괜찮은 강의를 찾을 수 있었다!

https://www.youtube.com/watch?v=TxIVr-nk1so

강의에서 나온대로 이것저것 공부해보고, 정리해보려고 한다!

첫번째로, 머신러닝이란 무엇인가에 대한 질문이다.

머신러닝, 영어 그대로 해석하면 기계학습이라는 뜻이다.

기계학습이 뭐지?라고 묻는다면 간단하게, 기계가 스스로 학습하는 것을 의미한다.

강의에서는 예시로 스팸메일을 분류하는 학습에 대해 나온다.

일일이 스팸메일을 기계에게 알려주고 특정한 스팸메일만을 분류할 수 있으나

이같은 경우에는 사람이 일일이 기계에게 학습시키는 것만으로는 불가능할 뿐더러 어렵다.

(프로그래머가 일일이 코딩하기엔 어려움)

따라서, 기존에 있는 스팸메일의 데이터를 가지고 특징을 학습한 후 유사한 스팸메일을 보았을 때도

악성메일이라 판단하게 하는 것 즉 스스로 학습하는 것을 바로 머신러닝이라 부른다.

이러한 학습방법은 두가지로 크게 나뉘는데,

첫번째가 지도 학습(Supervised learning)이다.

지도 학습은 라벨링이 된 training set을 가지고 학습을 진행하는 것이다.

예를 들어, 강아지와 고양이를 분류하는 모델을 형성할 경우

'강아지'라는 라벨링을 한 사진 데이터셋과 '고양이'라는 라벨링이 되어있는 사진 데이터셋을 가지고

기계가 학습하게 될 것이다.

두번째는 비지도 학습(Unsupervised learning)이다.

비지도 학습의 경우 미리 학습하기 위한 데이터셋이 존재하지 않으며

일반적으로 워드 클라우드나 구글 뉴스 그룹핑에 사용된다.

그중에서도 지도학습은 이미지 라벨링이나 이메일 스팸처리, 성적 예측 등에 쓰인다.

그중에서도 성적 예측과 같은 continuous scale의 경우 ( 0,1 로 나뉘지 않는 연속적인 숫자의 경우)

regression function을 사용한다.

입력값(x)에 대한 출력값(y)을 바탕으로 최적의 선을 찾는 것이 목표이며,

이러한 learning algorithm은 특정한 규칙에 따라 매 입력값에 대해 예측되는 결과값을 가진 함수 H를 제시한다.

그리고 H함수(hypothesis)는 일반적으로 이렇게 표현한다.

hθ(x)=θ0+θ1x

그리고 이러한 가설 함수의 매개변수를 결정해주기 위한 함수가 바로 loss function(cost)이다.

또한 이를 공식으로 나타내면 다음과 같다.

만약 cost function이 위의 이미지와 같고, 매개변수인 w가 1이라면 cost function의 결과값은 0이 될 것이다.

매개변수인 w의 값을 계속해서 증가시킨다면 cost function의 값은 계속해서 변화할 것이고,

이러한 과정을 거치다보면 아래와 같이 완만한 그래프가 나온다.

이중에서도 가장낮은 최적점 W를 찾는 것이 우리의 목표라고 볼 수 있다.

W를 어떻게,얼마나 변화 시켜야 최저점에 도달하는지 알기 위해 일반적으로

Gradient descent algorithm을 자주 사용한다.

W를 계속해서 수정함으로써 Cost function의 loss를 줄이는데,

W를 계산하는 공식은 다음과 같다.

여하튼 그래프의 어느 방향으로 이동하더라도, 최저점을 찾을 수 있다.

가중치(w)가 오른쪽에서 진행하는 경우, 기울기가 양수이므로 W의 크기가 작아져

왼쪽으로 이동할 것이고,

가중치(W)가 왼쪽에서 진행하는 경우 기울기가 음수이므로 W의 크기가 커지면서

오른쪽으로 이동하면서 기울기가 0에 근접할 때까지 이동할 것이다.

이러한 Gradient descent algorithm은 최저점을 찾는데 매우 용이한데,

그래프를 convex하게 하여 어느 지점에서 내려가더라도

무조건 최저점을 찾을 수 있게 한다.

아래는 내가 한 필기!

저작자표시 비영리 변경금지 (새창열림)

'Computer Science > Machine Learning💻' 카테고리의 다른 글

[2] 추정과 가설 검정 (0)	2020.11.08
[1] 이산형/연속형 확률분포 (0)	2020.11.05
데이터 사이언스 인터뷰(2) (0)	2020.11.01
데이터 사이언스 인터뷰(1) (0)	2020.11.01
easily image crawling with python and save in local drive (3)	2020.03.06

Reason of things

Reason of things

태그

최근글

댓글

공지사항

아카이브

'Computer Science > Machine Learning💻' 카테고리의 다른 글

관련글

티스토리툴바