[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)
Gensim 介紹
在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。
試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?
Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。
試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?
Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)之前在 《透過 Python API 在 WordPress 上自動發文》這篇文章有提過,我想要透過 Python 直接將自己在 WordPress 上發表過的文章下載下來,進行簡單的分類。在這之中,我找到的便是名為 python-wordpress-xmlrpc 模組。
Read More »[Python] 透過 python-wordpress-xmlrpc 套件將 WordPress 上發表的文章下載下來在使用 WordPress 經營個人 Blog 的過程中,有時候我常常會希望能夠將所有寫過的文章做個整理。當然,我想要使用的方法當然是『人工慢慢看』以外的方法,比如說透過『API』來取得 WordPress 相關的資料。
Read More »[Python] 透過 python-wordpress-xmlrpc 套件在 WordPress 上自動發文Numpy 是在 Python 處理資料時不可或缺的重要模組,常用於進行各種資料分析的工作。
Read More »[Python] 在 Numpy 中將數值轉成 One-Hot 型態SQLite 與一般 Server/Client 結構的資料庫不同, SQLite 被整合在應用程式當中,為一種嵌入式的資料庫,如果資料比較固定且數量不多,那麼使用 SQLite 可說是較為合適的。
Read More »[Python] 使用 sqlite3 模組建立嵌入式資料庫在開發專案的時候,雖然 SVG (Scalable Vector Graphics, 可縮放向量圖) 是非常好用的圖片格式,但有時候我們還是需要一般的 PNG 格式來製造界面。
Read More »[Python] 透過 svglib 將 SVG 轉成 PNG最近在學習機器學習模型的時候經常會遇到這個報錯:
'Object arrays cannot be loaded when allow_pickle=False'
Read More »[已解決] 'Object arrays cannot be loaded when allow_pickle=False'最近在學習各方大神在 Python 當中實做的各種深度學習模型,剛巧看到了一個不熟悉的模組:Fire。
當然,最早我是不知道 Fire 是一個什麼樣的模組,只覺得名字好怪。一查之下,挖賽不得了,原來這竟然是 Google 於 2017 年在 Github 上開源的套件。
Read More »[Python] 使用 Fire 套件直接使用終端機使用函式說到『使用 Python 做一個小型專案』,幾乎大部分的網路教學都是在教導怎麼『自己做一個音樂播放器』。無論怎麼說,能夠自己客製化一個音樂播放器,想想也還滿有趣的。
Read More »[Python] 使用 os 模組與 PyGame 套件播放音樂說到『文字雲』(word cloud),是一個我在研究自然語言處理(NLP)時常常會聽到的名詞。我本來一直以為就是計算詞的頻率,並將『頻率高的字顯示得比較大』而已——其實不然,光是組成的形狀、字該擺放的樣式都是學問,沒有我想得那麼簡單。
Read More »[Python] 使用 wordcloud 套件快速產生文字雲