반응형
생성 모델링
학습 목표
- 생성 모델링이 의미하는 것이 무엇인가?
- 판별 모델링과 생성 모델링은 어떻게 다른가?
- 생성 모델링에 필요한 문제를 다루기 위해 필요한 핵심 수학 개념과 프레임워크?
- 첫 번째 생성 모델(나이브 베이즈) 만들기
- 이 모델이 생성 가능한 공간의 크기와 복잡도가 증가함에 따라 실패하는 이유?
생성 모델링이란 무엇인가?
정의를 살펴보자 : 확률 모델의 관점으로 보면 생성 모델은 데이터셋을 생성하는 방법을 기술한 것이다. 이 모델에서 "샘플링"하면 새로운 데이터를 생성할 수 있다.
ex) 말 이미지로 이뤄진 데이터 셋이 있다고 가정을 하자. -> 이 데이터셋에는 없지만 진짜 말처럼 보이는 새로운 이미지를 생성하는 모델을 만들고 싶다!
- 이 모델은 말의 외관을 결정하는 일반적인 규칙을 학습해야 하는데,, 이것이 생성 모델링을 사용해 풀 수 있는 문제의 종류이다.
- 먼저 생성하려는 개체의 샘플이 많이 필요(데이터 셋)-> 이를 훈련 데이터라고 불린다.
- 데이터 포인트 하나를 -> 샘플이라고 한다!
- 각 샘플은 많은 특성으로 이루어지는데? -> 이미지라면, 픽셀값 그렇다면 이 픽셀을 새로 만든다.. -> 어떤 확률적인 분포에서 확룔죽으로 픽셀 값을 구해야 한다.
생성 모델링과 판별 모델링은 어떻게 다른가?
- 판별 모델링 : 샘플 x가 주어졌을 때 레이블 y의 확률 p(y|X)을 추정한다.
- 생성 모델링 : 샘플 x의 관측확률 p(X)를 추정한다.
- 우리는 원본 훈련 데이터셋에 속할 가능성이 높은 픽셀을 출력하는 생성 모델을 훈련하는 것이다.
머신러닝?
- 머신러닝 문제는 비지니스 문제와 깊은 관계가 있어서, 그 발전 속도가 빠르다.
생성모델?
- 사람의 상상을 생각하면 된다.
- 사람의 상상은 어떤 것을 예측하는 판별 모델이 아니라, 어떤 데이터에 기반해서 어떤 것을 생성하는 생성모델이다.
생성 모델링 프레임워크
- 2차원 생성 모델링 게임?
- 어떤 2차원 공간에 수많은 점들이 존재한다고 치자, 이 때 이 공간의 다른 포인트 X를 선택하는 것이 목표이다.
확률적 생성 모델
용어 이름 | 설명 |
---|---|
표본 공간 | 샘플 X가 가질 수 있는 모든 값의 집합입니다. |
확률 밀도 함수 | 표본 공간의 샘플들을 0~1 사이로 스케일링 하는 것을 의미한다. |
모수 모델 | p(X)는 한정된 개수의 파라미터 쎼타를 사용해 묘사하는 확률 밀도 함수이다. |
가능도 | 샘플 포인트(데이터)x가 주어졌을 때 쎼타의 알맞은 정도를 측정하는 함수 |
최대 가능도 추정 | 확률 밀도 함수의 파라미터 집합 쎼타에서 관측된 데이터 X를 가장 잘 설명할 수 있는 쎄타헷을 찾는 방법 |
헬로 로들!
50가지의 데이터셋
- 각 데이터의 특성
face_id | accessoriesType | clothingColor | closingType | hasColor | topType |
---|---|---|---|---|---|
0 | Round | White | ShirtScoopNeck | Red | ShortHairshortFlat |
반응형