Skip to content

Python

[PyTorch] nn.Embedding() 讀取 Gensim 預訓練模型權重方法筆記

使用 PyTorch 搭建關於自然語言處理相關任務的人,想必都對 PyTorch 當中的 nn.Embedding() 不陌生。nn.Embedding() 是 PyTorch 當中的一個嵌入層,可以讓我們將不同的詞編號之後放入,並產生一組我們可以任意指定的向量回傳。

Read More »[PyTorch] nn.Embedding() 讀取 Gensim 預訓練模型權重方法筆記

[NLP] BLEU 計算相似度

BLEU 是一種評估文字相似度的演算法,經常用於評估『機器翻譯』與『人工翻譯』之間的相似度。最近由於有比對文句之間相似度與否的需求,故在他人推薦之夏稍微研究了一下 BLEU 的原理,同時試用了 NLTK 中提供的 BLEU 函式。

Read More »[NLP] BLEU 計算相似度