꿈이 너무 많은 한 대학생의 공간

Model Representation (모델 표현) 본문

Coursera 문서 번역/Machine Learning

Model Representation (모델 표현)

청울울청 2020. 10. 26. 20:37

머신러닝을 공부하면서 사용하기 위해 개념을 하나 세우자면, 우리는 x(위첨자 i)를 입력값으로 놓을 것입니다. (주택 가격 예측 문제를 예로 들면, 주택의 평수 등) 그리고 y(위첨자 i)를  출력값으로 놓을 것입니다. (우리가 예측할려는 주택의 가격)

x(위첨자 i), y(위첨자 i) 쌍은 훈련 데이터셋(Training Example)이라고 부릅니다. 또한, 우리는 모델을 학습시키기 위해서 이 훈련 데이터셋을 활용할 것입니다. 

위첨자 i는 몇 번째 훈련 데이터셋인지 표시하는 역할을 합니다. 또한, X를 입력값들의 공백, Y를 출력값들의 공백으로 놓을 것이며, 이 예제에서는 X = Y = ℝ 입니다.

지도학습을 더 공식적으로 묘사한다면, 훈련 데이터셋을 받은 상태에서 우리의 목표는 h(x)를 y 값들의 데이터셋들에 맞춰 "더 정확한" 예측 모델을 만들기 위해 h : X -> Y 함수를 학습시키는 것입니다. 이 함수 h(x)는 가설(Hypothesis)라고 불립니다. 그림으로 보자면, 형태는 이렇게 될 것입니다.

위와 같이 주택 가격을 예측하는 문제에서, 우리가 예측하려고 하는 값이 연속적일 때 우리는 이 문제를 회귀 문제(Regression Problem) 이라고 부릅니다. y가 오직 이산값(0 또는 1) 만을 가질 수 있을 때에는, 우리는 이것을 분류 문제(Classification Problem) 이라고 부릅니다.

Comments