Python

[Python] wordcloud 模組使用 mask 生成特定形狀、顏色

Clay
2020-04-242021-06-23
NLP, Packages, Python

wordcloud 是個 Python 中用於產生文字雲的模組，之前我也簡單地寫過該怎麼使用這個套件來製作文字雲。不過今天我更進一步地研究了設定 wordcloud 依照不同的『圖片遮罩』來產生不同形狀的文字雲、甚至控制文字雲的顏色。

[Python] Matplotlib 繪圖時去白邊的問題

Clay
2020-04-242021-06-22
Packages, Python

Matplotlib 是 Python 中相當著名的繪圖套件，也是所有使用 Python 進行資訊視覺化的人一定會接觸到的工具之一。不過每次在我使用 matplotlib 進行繪圖的時候，有時候會苦惱於繪製出的圖形有著多餘的『白框』的問題，對我而言是不太美觀的。

[已解決] (2020/04/23 更新) Python GoogleNews 中文無法返回搜尋結果的可能解決方法

Clay
2020-04-232021-06-22
4 Comments
Packages, Python

今天我在重新使用 Python 中可以自動返回搜尋結果的套件 “GoogleNews” 時 (可以參考我之前寫過的《GoogleNews —— 輕鬆拿到 Google News 新聞的 Python 套件》) ，可能是因為我升級過這個套件的版本，在英文搜尋上沒有問題、可是在中文搜尋上卻沒有返回搜尋結果、也沒有報錯。

[Python] split() 和 splitlines() 函式的使用方法

Clay
2020-04-222021-06-22
Python

在 Python 中，我們若是想要將一段文本依照『特定字元』來切割，讓文本變成一段段的 List 資料型態儲存著，我們可以簡單地使用 split() 這個函式來完成。

[NLP][Python] 使用 FastText 訓練詞向量

Clay
2020-04-212021-06-22
2 Comments
NLP, Packages, Python

FastText 是由 Facebook AI Research Lab (FAIR) 所開發的『詞嵌入』以及『文本分類』，支援 294 種語言，並且使用類神經網路訓練詞嵌入模型。

[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲

Clay
2020-04-212021-06-22
6 Comments
Packages, Python

一直以來，我都想要寫一篇爬蟲的心得文，描述下 Regular Expression、IP 設置、User-Agent …… 等等經常會用到的各種工具或小知識。一方面是因為當初寫 Blog 的初衷便是想要紀錄下自己學習的過程、一方面則是因為現在花了很多時間進行爬蟲的工作，怕將來若是比較少做，就會慢慢淡忘現在比較熟練的爬蟲技能。