Skip to content

Blog

[PyTorch] nn.Embedding() 讀取 Gensim 預訓練模型權重方法筆記

使用 PyTorch 搭建關於自然語言處理相關任務的人,想必都對 PyTorch 當中的 nn.Embedding() 不陌生。nn.Embedding() 是 PyTorch 當中的一個嵌入層,可以讓我們將不同的詞編號之後放入,並產生一組我們可以任意指定的向量回傳。

Read More »[PyTorch] nn.Embedding() 讀取 Gensim 預訓練模型權重方法筆記

[PyTorch] 如何使用 Hugging Face 所提供的 Transformers —— 以 BERT 為例

2018 年年底,以 BERT 為首等 Transformer 模型席捲了各大 NLP 競賽的排行榜,並幾乎都有著相當優異的表現。一直以來我都對 BERT 等 Transformer 模型充滿了興趣,故今天便開始動手紀錄該如何使用 Hugging Face 所開發的 Transformers 套件。

Read More »[PyTorch] 如何使用 Hugging Face 所提供的 Transformers —— 以 BERT 為例

[NLP] BLEU 計算相似度

BLEU 是一種評估文字相似度的演算法,經常用於評估『機器翻譯』與『人工翻譯』之間的相似度。最近由於有比對文句之間相似度與否的需求,故在他人推薦之夏稍微研究了一下 BLEU 的原理,同時試用了 NLTK 中提供的 BLEU 函式。

Read More »[NLP] BLEU 計算相似度