문제 해설

Token Embedding + PE (더하기)

신경망 · easy

preview

Token Embedding + Positional Encoding

Transformer 입력 = 토큰 임베딩 + 위치 인코딩. embedding-lookup-v1, positional-encoding-sinusoidal-v1 두 조각을 합치는 과정.

$X_{b,l,:} = E[\text{idx}_{b,l}] + \text{PE}[l]$

배치 축 B 에서 PE 는 broadcasting — 같은 PE 를 모든 배치에 더함.

함수 add_positional_encoding(E, idx_batch, pe) 를 완성하세요.

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.