
여러 토큰의 임베딩(88) 을 평균해 하나의 벡터로 뭉치는 간단한 문장/문서 표현. Word2Vec 이전 시대에 텍스트 분류에서 강력한 베이스라인으로 통했고, fastText 나 recommender 에서도 기본 블록.
수식:
shape: idx_batch (B, L) → output (B, D).
함수 bag_of_embeddings(E, idx_batch) 를 완성하세요.
E shape (V, D).idx_batch shape (B, L) 정수.(B, D).E[idx_batch] → shape (B, L, D) → .mean(axis=1).| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (B, D) | |
| 2 | L=1 → embedding_lookup 와 동일 | |
| 3 | 같은 토큰 반복 → 그 벡터 그대로 | |
| 4 | 평균 수식 일치 | |
| 5 | 다양한 B, L | 3×4, 5×2 등 |
코드를 작성하고 Run 을 눌러보세요.