문제 해설

SIF Weighted Bag (Arora et al. 2017) [medium]

신경망 · medium

preview

SIF (Smooth Inverse Frequency) Bag [medium]

v1 bag-of-embeddings 은 단순 평균. Arora et al. (2017) "A Simple but Tough-to-Beat Baseline" 는 확률 역수 가중을 제안:

$\mathbf{s}_b = \frac{\sum_l w_l \cdot E_{\text{idx}_{b,l}}}{\sum_l w_l}, \quad w_l = \frac{a}{a + p(\text{idx}_{b,l})}$

여기서 $p(w)$ 는 token 확률 (코퍼스 빈도), $a \approx 10^{-3}$ .

Word2Vec/GloVe 평균 + SIF → 많은 semantic benchmark 에서 LSTM/CNN 을 이김 (간단한 baseline 이 강력한 이유).

함수 sif_bag(E, idx_batch, probs, a=1e-3) 를 완성하세요.

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.