본문 바로가기

반응형

인공지능/딥러닝

(14)
1. 처음부터 시작하는 머신러닝과 딥러닝: 입문자를 위한 완벽 가이드 영어 공부를 하면서 그동안 놓고 있었던, 머신러닝, 인공지능 공부를 다시 시작하려고 한다. 처음부터 천천히 다시 시작해보자. 머신러닝이란?어떤 작업 T에 대해 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 성능 P가 향상됬다면, 컴퓨터는 경험 E를 통해 학습한 것이라고 한다. - 톰 미첼 머신러닝을 사용하는 이유?전통적인 프로그래밍 기법을 사용해서 스팸 필터를 만든다고 했을 때, 스팸 메일에서 나타나는 공통적인 단어들을 알고리즘으로 작성해 이를 스팸메일로 분류할 수 있는데, 이런식으로 공통적인 단어들을 모두 찾아 작성하기에는 한계가 있다, 반면에 머신러닝 기법을 사용한다면? 알고리즘을 컴퓨터가 직접 학습해 최적의 기준을 만들어 스팸메일을 자동으로 구분하기 때문에, 유지보수에 있어 편하고, 성능 또..
RNN 개념 정리 1. 순환 뉴런과 순환 층 순환 뉴런 순환 층 시간에 따른 네트워크 메모리 셀 입력과 출력 시퀀스 시퀀스-투-시퀀스 시퀀스-투-벡터 벡터-투-시퀀스 시퀀스-투-벡터-벡터-투-시퀀스 (인코더 디코더) 2. RNN을 훈련하는 방법 BPTT ( Back propagation Through Time) 3. 시계열 데이터 학습 후 추론 코드 심층 RNN 사용 4. 긴 입력데이터 (시퀀스) 다루기 긴 입력데이터를 다룰 경우 문제점 그레이디언트 폭주 문제 단기기억 문제 -> LSTM 5. LSTM 핍홉 연결 LSTM GRU LSTM
핸즈온 머신러닝 Chapter5. 서포트 벡터 머신 서포트 벡터 머신 (SVM)은 매우 강력하고 선형이나 비선형 분류, 회귀, 이상치 탐색에 사용할 수 있는 다목적 머신러닝 모델이다. 특히 복잡한 분류 문제에 강하다. (작거나, 중간 크기의 데이터셋에 적합함) 5.1 선형 SVM 분류 SVM은 기존 선형 분류 모델에 의해 생긴 결정 경계 근처에 있는 데이터 때문에 만들어졌다. 결정 경계에 샘플 데이터가 너무 가까워지면서 결정 경계 근처에 있는 데이터에 대해 모델이 잘 작동하지 못하는 점을 반영했습니다. 따라서 결정 경계를 만드는 데 근처 데이터 샘플에 대해서 가장 큰 폭을 형성하고 있는 결정 경계를 찾는다라고 할 수 있습니다. --> 이런 이유로 "Large Margin Classification"이라고도 불립니다, 또한 도로 경계에 위치한 샘플에 의해 ..
핸즈온 머신러닝 챕터 4장 연습문제 풀이 수백만 개의 특성을 가진 훈련 세트에서는 어떤 선형 회귀 알고리즘을 사용할 수 있을까요? 선형 회귀 알고리즘에는 다음과 같은 알고리즘이 존재합니다. 선형 회귀 알고리즘 정규방정식 SVD 배치 경사 하강법 확률적 경사 하강법 미니배치 경사 하강법 단, 정규방정식은 특성 수가 두 배로 늘어나면, 계산 시간이 8배로 늘어난다는 단점이 존재합니다. 이외의 다른 알고리즘들은, 선형적으로 계산 시간이 늘어나게 됩니다. 예를 들어 특성의 수가 두배 증가한다면, 계산시간도 두배 증가하게 됩니다. 훈련 세트에 있는 특성들이 각기 아주 다른 스케일을 가지고 있습니다. 이런 데이터에 잘 작동하지 않는 알고리즘은 무엇일까요? 그 이유는 무엇일까요? 이 문제를 어떻게 해결할 수 있을까요? 특성들이 다른 스케일을 갖는 데이터에 ..
핸즈온 머신러닝 Chapter4. 모델 학습 학습 정리 모델을 훈련시키자. 모델을 훈련시킨다는 것은 모델이 훈련 세트에 가장 잘 맞도록 모델 파라미터를 설정하는 것이다. 직접 계산할 수 있는 공식을 사용해 훈련 세트에 가장 잘 맞는 모델 파라미터를 해석적으로 구한다. 경사 하강법 (GD)이라 불리는 반복적인 최적화 방식을 사용하여 모델 파라미터를 조금씩 바꾸면서 비용함수를 훈련 세트에 대해 최소화시킨다. 경사 하강법의 변종? Batch 경사 하강법 Mini - Batch 경사 하강법 Stichastic 경사 하강법이장을 이해하기 위해서? 기초적인 선형대수와 미분 기호를 사용한 수학 방정식이 나오기 떄문에, 이 식들을 이해하기 위해서는 벡터와 행렬, 전치, 점곱, 역행렬, 편미분에 대해 알아야 합니다. 선형대수에 대한 주피터 노트북 선형 회귀 입력 가중치 합과..
Chapter 3 핸즈온 머신러닝 연습문제 풀이 1. MNIST 데이터셋으로 분류기를 만들어 테스트 세트에서 97% 정확도를 달성해보세요. 힌트 : KNeighborsClassifier가 이 작업에 아주 잘 맞습니다. 좋은 하이퍼파라미터 값만 찾으면됩니다. ->(weights, n_neighbors 하이퍼파라미터로 그리드 탐색을 시도해보세요.) # mnist 데이터 세트 불러오기 from sklearn.datasets import fetch_openml from sklearn.model_selection import cross_val_score from sklearn.neighbors import KNeighborsClassifier mnist = fetch_openml('mnist_784', version=1, as_frame=False) X, y ..
Chapter2. 핸드온 머시러닝 연습문제 답 1. 서포트 벡터 머신 회귀(sklearn.svm.SVR)를 kernel="linear" 나 kernel="rbf" 등의 다양한 파라미터 설정으로 시도해보세요. 지금은 이 하이퍼파리미터가 무엇을 의미하는지 너무 신경 쓰지 마세요. 최상의 SVR 모델은 무엇인가요? 다음 코드로 데이터를 다운, 불러와서, 전처리 과정을 끝마친다. 훈련 데이터 이름 : (housing_prepared, housing_labels # 데이터 가져오기 import os import tarfile import urllib DOWNLOAD_ROOT = "https://raw.githubusercontent.com/ageron/handson-ml2/master/" HOUSING_PATH = os.path.join("datasets",..
핸즈온 머신러닝 1장 연습문제 풀이! Chapter1. 연습문제 1. 머신러닝을 어떻게 정의할 수 있나요? 머신러닝은 데이터에서 어떤 규칙을 학습해 정답을 예측하는 것이다. 2. 머신러닝이 도움을 줄 수 있는 문제 유형 네 가지를 말해보세요. 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제 전통적인 방식으로는 해결 방법이 없는 복잡한 문제 유동적인 환경에 놓인 문제 복잡한 문제와 대량의 데이터에서 통찰을 얻는 문제 3. 레이블된 훈련 세트란 무엇인가요? 머신러닝에는 지도학습이란 방법이 존재한다. 이 지도학습은 훈련데이터에 레이블, 즉 정답이 달려 있는 것을 의미한다. 따라서 레이블된 훈련 세트란 → 훈련 데이터에 정답이 달려있는 데이터를 의미합니다. 4. 가장 널리 사용되는 지도 학습 작업 두 가지는 무엇인가요? 분류 회귀 5. 보편..

반응형