pytorch, tensorflow

[PyTorch] Embedding 추가하기

2022. 10. 1. 11:16
목차
  1. 1. Embedding 추가하기

hugginface의 여러 모델들을 사용하다보면 vocab_size가 달라 임베딩 차원이 안맞는 경우가 생긴다. 이때 임베딩 차원을 추가하면 문제를 해결할 수 있다.

 

1. Embedding 추가하기

torch.nn.Embedding 모델에 새로운 아이템들을 더할 수 있는 방법은 아래와 같다.

vocab_size = 10
emb_dim = 128

# 기존에 학습 완료된 임베딩
original_emb = torch.nn.Embedding(vocab_size, emb_dim)

# 추가하거나 새로 학습하고자 하는 vocab의 임베딩
new_vocab_size = 2
to_add_emb = torch.nn.Embedding(new_vocab_size, emb_dim)


# 각 임베딩의 parameter를 합쳐 임베딩 차원 늘리기
new_emb_weights = torch.cat((original_emb.weight, to_add_emb.weight), dim=0)
new_emb = original_emb.from_pretrained(new_emb_weights)

print(new_emb)
>>>> Embedding(12, 128)

 

 

[참고링크]

  • stackoverflow
728x90
저작자표시 비영리 변경금지 (새창열림)

'pytorch, tensorflow' 카테고리의 다른 글

[PyTorch] torch.cat(), torch.stack() 비교  (0) 2022.10.01
[pytorch] torch.reshape에 관하여  (0) 2022.07.11
[tensorflow 2.0] model.save, model.save_weights 차이  (0) 2021.04.01
[pytorch] torch에서 parameter 접근하기  (0) 2021.03.19
  1. 1. Embedding 추가하기
'pytorch, tensorflow' 카테고리의 다른 글
  • [PyTorch] torch.cat(), torch.stack() 비교
  • [pytorch] torch.reshape에 관하여
  • [tensorflow 2.0] model.save, model.save_weights 차이
  • [pytorch] torch에서 parameter 접근하기
Fine애플
Fine애플
이것저것
끄적끄적이것저것
Fine애플
끄적끄적
Fine애플
전체
오늘
어제
  • 분류 전체보기 (167)
    • 논문 및 개념 정리 (27)
    • Pattern Recognition (8)
    • 개발 (57)
    • python 메모 (45)
    • pytorch, tensorflow (5)
    • 알고리즘 (9)
    • Toy Projects (4)
    • 통계이론 (2)
    • Reinforcement Learning (10)

블로그 메뉴

  • 홈

공지사항

인기 글

태그

  • nlp
  • miniconda
  • container
  • 언어모델
  • Bert
  • Docker
  • pandas
  • ubuntu
  • GPU
  • 알고리즘
  • Probability
  • reinforcement learning
  • 딥러닝
  • 자연어
  • BigBird
  • 개발환경
  • PyTorch
  • transformer
  • tensorflow
  • python

최근 댓글

최근 글

hELLO · Designed By 정상우.
Fine애플
[PyTorch] Embedding 추가하기
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.