본문 바로가기

Tensorflow

학습의 종류: 지도학습, 비지도학습, 강화학습 지도학습, Supervised Learning Labeling된 데이터를 가지고 모델을 통해 학습. 예를 들어 사람들의 사진에 각각 해당 사람의 인종 정보가 레이블링된 학습 데이터셋이 존재하는 경우의 학습이다. 학습 데이터셋 모델을 수학적 함수의 형태로 표현할 수 있다. y = f(x)에서 x는 데이터의 픽처 벡터라고 하고, x와 연관되는 레이블을 f(x)라고 한다. 즉, x가 입력되었을 때의 정답 값은 f(x)이다. 어떤 y는 단 하나의 값만을 가질 수 있는데, 그런 경우 이 모델을 분류자라고 한다. Classifier 이와 달리 y가 여러 개의 순서가 있는 값들을 가질 수 있는 경우, 그 모델을 회귀자 혹은 복귀자라고 한다. Regressor 모델에 대한 예측(Estimation)을 g(x)라고 하자.. 더보기
머신러닝의 기초 [이 글은 책 "텐서플로를 활용한 머신러닝"을 읽고 정리한 글입니다.] [학습 파이프라인의 개요] 학습 데이터를 피처 벡터의 형태로 가공하고, 그를 학습 알고리즘에 넣어서 모델을 만든다. 학습 알고리즘은 모델을 선택하고 모델의 파라미터들을 효율적으로 탐색한다. [일반적인 추론 방법] 테스트 데이터를 가지고 피처 벡터를 만들고, 이를 기존에 있던 모델 중 적절해 보이는 것에 넣어서 의도한 결과를 출력한다. [피처 벡터] 피처는 어떤 오브젝트의 관찰 가능한 속성을 의미한다. 예를 들어 자동차라는 개체가 있을 때, 자동차를 대표할 수 있는 데이터는 연비, 길이, 무게 등일 것이다. 피처는 수학적인 데이터 형식을 따라야 한다. 벡터, 행렬, 그래프가 대표적인 형태이다. 결국 피처란, 현실 세계의 복잡성을 특징을.. 더보기
[Tensorflow] Linear Regression 위와 같은 데이터가 주어진다. 지금 결과 데이터의 형태가 0 ~ 100의 넓은 범위를 가지고 있기 때문에 regression이다. 이 데이터를 가지고 trainning을 하자. 여러 가설을 가진 Linear 함수가 나올 수 있다. Linear regression이기 때문에 Hypothesis H(x) = W*x + b 로 일반화할 수 있다. 이때, W와 b를 결정하는 것이 핵심이다. 여러 Hypothesis H(x) 중에 어떤 것이 가장 나은가? 를 어떻게 측정할 것인가? -> Cost function or Loss function hypothesis 함수를 H(x)라 하고, 주어진 데이터를 y라고 하자. ( H(x) - y )^2 을 계산하면 예측값과 실제값의 차이를 계산할 수 있을 것이다. 제곱을 하.. 더보기
[Tensorflow] 텐서플로우의 기초 구글에서 제공하는 딥러닝 모듈 Tensorflow에 대해서 알아보자. Tensor는 계산 그래프 그래프를 실행시킨다. 의 방식으로 돌아간다. Tensor 텐서는 기본적으로 array이다. 다차원 array를 주로 쓰기 때문에 수학에서 쓰는 Rank라는 개념을 도입하여 생각한다. Rank는 차원의 다른 말이다. 예를 들어, 하나의 변수를 저장하고 있는 텐서는 0차원이고 Rank가 0이다. (수학에서 스칼라) 하나의 list를 저장하고 있는 텐서는 1차원이고 Rank가 1이다. (수학에서 벡터) 하나의 2차원 list를 저장하고 있는 텐서는 Rank가 2이다. (수학에서 Matrix) 3-Tensor, ..., n-Tensor 등등 Shapes 각각의 몇 by 몇 Matrix인가? 0차원 텐서는 오직 1개의.. 더보기