← 전체로 돌아가기
프로젝트 메모 ai -home-son-prj-dataset

SD/ControlNet/LoRA 모델 재현 환경 설정

SD/ControlNet/LoRA 모델 재현 프로젝트 환경 설정 가이드.

stable-diffusioncontrolnetloraml-projectgpu-resource

SD/ControlNet/LoRA 모델 from-scratch 재현 프로젝트 환경 설정이야. 성능까지 확인하는 게 목표니 참고해.

  • 데이터셋: LAION-5B 대신 큐레이션된 서브셋 위주로 제안해야 함.
  • 경로: 작업은 /home/son/prj/dataset, 데이터는 /mnt/4tb (2.3TB 가용).
  • 하드웨어: RTX PRO 6000 Blackwell 96GB VRAM 싱글 GPU.
  • 스토리지: 12TB 중 4TB만 마운트됨. 추가 8TB는 필요시 마운트 가능하니, 가용 공간을 주기적으로 확인해야 해.
df -h /mnt/4tb

여기서 배울 것

  1. 모델 재현 시 성능 검증까지 목표로 잡아야 함.
  2. 대규모 데이터셋은 현실적으로 큐레이션된 서브셋을 활용해야 함.
  3. 고성능 GPU (96GB VRAM) 활용 계획을 세워야 함.
  4. 스토리지 가용 공간을 주기적으로 확인하고 필요시 확장해야 함.
원본 파일 보기 (.claude/projects/-home-son-prj-dataset/memory/project_sd_reproduce.md)
---
name: SD/ControlNet/LoRA from-scratch 재현 프로젝트
description: 유저가 Stable Diffusion, ControlNet, LoRA 논문을 from scratch로 구현 및 학습 재현하는 프로젝트
type: project
originSessionId: 3810bfd4-624e-4a06-91c4-3189931063d1
---
목표: Stable Diffusion, ControlNet, LoRA 논문을 from-scratch로 구현하고 어느 정도 성능까지 재현하는 것.

**Why:** 유저는 아키텍처/수식 재현과 "성능까지는 나와야 한다"는 목표를 함께 가짐. 순수 교육용이 아니라 실제 생성 품질까지 확인하려는 목적.

**How to apply:**
- 재현용 데이터셋 제안 시 원본 full-scale(LAION-5B 등)은 비현실적이므로 curated subset 위주로 제안.
- 작업 디렉토리는 `/home/son/prj/dataset`, 데이터 저장은 `/mnt/4tb` (가용 ~2.3TB).
- 하드웨어: RTX PRO 6000 Blackwell 96GB VRAM single GPU.
- 12TB HDD 중 현재 4TB만 마운트됨. 나머지 8TB는 필요 시 추가 마운트 가능.