Skip to content

Blog

[PyTorch] 旅館評論情感分析實戰紀錄 (1)

接續之前旅館評論分類的工作,詳情請參閱《[PyTorch] 旅館評論情感分析實戰紀錄 (0)》這篇文章,我再次對原本的分類模型進行了簡單的改良。至於改良了什麼呢?還記得我在上一篇文章中提到我只是胡亂地將每個字斷開,個別給相異字一個 Index 去代表該字——簡單來講,就只是把文字資料轉成單個數字,好用來進行 Machine Learning。

Read More »[PyTorch] 旅館評論情感分析實戰紀錄 (1)

[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)

Gensim 介紹

在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。

試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?

Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)