[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)
Gensim 介紹
在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。
試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?
Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。
試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?
Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)Read More »[PyTorch] 旅館評論情感分析實戰紀錄 (0)『旅館評論情感分析』是一個適合訓練分類模型的自然語言處理(NLP)任務。今天是我隨意開始嘗試的第一天,於是我找了個 GitHub 上的旅館評論資料集專案,並訓練了一個由全連接層(fully-connected layer)組成的分類模型,並以 accuracy、precision、recall、F1-score 作為我的指標分數評估模型好壞。
在使用 PyTorch 這個好用的 Python 深度學習框架進行模型的訓練時,常常會有剛學習的人忘記把訓練好的模型『儲存』起來 —— 甚至根本沒意識到這回事,以為每次要使用都必須訓練一次。(其實這是我的黑歷史 XDDD)
Read More »[PyTorch] 如何儲存模型、讀取模型之前在 《透過 Python API 在 WordPress 上自動發文》這篇文章有提過,我想要透過 Python 直接將自己在 WordPress 上發表過的文章下載下來,進行簡單的分類。在這之中,我找到的便是名為 python-wordpress-xmlrpc 模組。
Read More »[Python] 透過 python-wordpress-xmlrpc 套件將 WordPress 上發表的文章下載下來在使用 WordPress 經營個人 Blog 的過程中,有時候我常常會希望能夠將所有寫過的文章做個整理。當然,我想要使用的方法當然是『人工慢慢看』以外的方法,比如說透過『API』來取得 WordPress 相關的資料。
Read More »[Python] 透過 python-wordpress-xmlrpc 套件在 WordPress 上自動發文Python 是個簡單優雅的語言,可以使用很少的指令來達成我們想要的功能,故也是目前相當多人用於統計分析的程式語言。
Read More »[Python] 如何透過 Dict 或 Counter 模組統計數量生成對抗網路 (generative adversarial network, GAN) 是一個相當有名的神經網路模型,其功用為我們輸入一組『噪音』(Noise),然後通過 Generator 產生出一組數字圖片,再經由 Discriminator 分辨是否是真正的圖片。
Read More »[Pytorch] 搭建 GAN 模型產生虛假的 MNIST 圖片我曾經以為讓程式的視窗在『最前方』或『最後方』(或是你習慣稱『最上方』與『最下方』)是一件相當麻煩的事情,但在 PyQt5 當中幾乎只要一行指令就可以完成這個功能了。
Read More »[PyQt5] 讓窗口位於螢幕最前方或最後方pprint 是 Python 當中標準化輸出的一種輸出模式,很經典的一種模式便是將 Dictionary 的資料型態按照 Key-Value 由上到下印出,屬於人類較容易閱讀的版面。
Read More »[Python] 使用 pprint 印出標準化的輸出