클래스 조건부 생성과 CFG(선명도 손잡이) — 같은 모델로 13종 골라 그리기
앞 페이지의 모델은 "아무거나" 그렸어요. 이번엔 "얼룩말을 그려줘"처럼 종류를 골라 그리게 만듭니다. 방법은 의외로 간단해요 — 모델에게 노이즈 그림과 단계 t뿐 아니라 "지금 그리는 건 9번(얼룩말)이야"라는 힌트(클래스 번호)도 같이 줍니다.
클래스 번호를 임베딩(작은 숫자 벡터)으로 바꿔, 단계 정보와 합쳐 모델에 넣어요.
그러면 같은 모델이 "고양이 모드", "버스 모드"처럼 다르게 동작합니다.
클래스 번호 0~1213종 중 무엇을 그릴지임베딩 → 시간 정보에 +그림 만드는 내내 힌트 유지10% 확률로 힌트 제거CFG를 쓰려고 일부러 가림학습할 때 일부러 10%는 힌트를 지워 "아무거나 모드"도 함께 배우게 했어요. 이게 다음에 나올 CFG의 비밀 재료입니다.
Classifier-Free Guidance는 그림 AI의 "선명도 손잡이"예요. 생성할 때 모델을 두 번 돌립니다: 하나는 힌트 있음("고양이"), 하나는 힌트 없음("아무거나"). 그리고 둘의 차이를 과장해서 더합니다.
아래는 같은 노이즈에서 시작해 guidance scale만 바꿔 생성한 결과예요.
이제 클래스를 지정해 한 종씩 그려봤어요. 배운 13종 안에서는 그 종류다운 형태와 색이 나옵니다. (배우지 않은 것, 예를 들어 "비행기"는 번호 자체가 없어서 그릴 수 없어요 — 이게 도메인 제한입니다.)
다음 → 잠재공간 디퓨전으로 진짜 Stable Diffusion 구조 완성