tensorflow 선형회귀 예제

Off
Non classé

이 문서에서는, 우리는 numpy, 텐서 플로우 및 matplotlib.pyplot와 같은 인기있는 모듈의 일부를 사용합니다. 가져 오봅시다. 이 문서에서는 그라데이션 하강 알고리즘을 사용하여 선형 회귀 문제를 해결하는 방법을 소개했습니다. 선형 회귀의 한 가지 문제는 데이터에 적합하지 않은 경향이 있으며 이 문제를 해결하는 한 가지 방법은 로컬에 가중치가 있는 선형 회귀라고 하는 기술입니다. 이 기술에 대한 자세한 내용은 [1]에서 확인할 수 있습니다. 여기서 기능 열 직업의 가능한 각 값은 교육에서 만날 때 정수 ID로 해시됩니다. 예제 배치에는 몇 가지 다른 직업이 있습니다: 감독학습의 중요한 알고리즘은 선형 회귀입니다. 이 기사에서는 [1] (참조 섹션)에서 언급 한 다음 표기법 (참조 섹션)을 다시 사용할 것입니다. 개인의 나이, 교육, 결혼 여부 및 직업(기능)이 포함된 인구 조사 데이터를 사용하여 연간 50,000달러 이상을 벌고 있는지 여부를 예측합니다(대상 라벨).

우리는 개인의 정보를 감안할 때 0에서 1 사이의 숫자를 출력하는 물류 회귀 모델을 훈련할 것이며, 이는 개인이 연간 소득이 50,000 달러 이상일 확률로 해석 될 수 있습니다. 참조: https://www.tensorflow.org/api_docs/python/tf/Variable 각 기본 피쳐 열을 별도로 사용하면 데이터를 설명하기에 충분하지 않을 수 있습니다. 예를 들어 교육과 레이블(수입 50,000달러)의 상관관계는 직업마다 다를 수 있습니다. 따라서 교육= »학사 »와 교육= »석사 »에 대한 단일 모델 가중치만 학습하는 경우 모든 교육-직업 조합을 캡처하지 는 않습니다(예: 교육= »학사 » 및 직업= »Exec-managerial » AND 교육= »학사 » 및 직업= »공예 수리 »). 그러나 이 접근 방식은 확장성이 매우 제한적입니다. 더 큰 데이터 집합은 디스크에서 스트리밍해야 합니다. census_dataset.input_fn은 tf.decode_csv 및 tf.data.dataset을 사용하여 이 작업을 수행하는 방법의 예를 제공합니다.TextLineDataset: wi`s가 매개 변수(가중치라고도 함)는 X에서 Y로 매핑되는 선형 함수의 공간을 매개변수화합니다.

Comments are closed.