Skip to content

Python Packages

[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲

一直以來,我都想要寫一篇爬蟲的心得文,描述下 Regular Expression、IP 設置、User-Agent …… 等等經常會用到的各種工具或小知識。一方面是因為當初寫 Blog 的初衷便是想要紀錄下自己學習的過程、一方面則是因為現在花了很多時間進行爬蟲的工作,怕將來若是比較少做,就會慢慢淡忘現在比較熟練的爬蟲技能。

Read More »[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲

[Python] 在終端機中輸出有顏色的文字

在使用 Python 進行程式的撰寫時,有時候我們會希望我們印出的文字在終端機上能夠顯示出不同的顏色;一來這樣賞心悅目、二來可以區分不同的重點——例如我現在之所以會寫下這篇心得筆記來紀錄如何印出『不同顏色的文字』,就是因為在寫各種不同的測試腳本時,希望畫面上印出的資訊能夠區分不同的程式段落。

Read More »[Python] 在終端機中輸出有顏色的文字

[Python] 使用 gdown 套件來下載 Google 雲端硬碟的檔案

之前我曾經寫過《使用 wget 下載 Google 雲端硬碟的檔案》這篇文章,紀錄著如何使用 Linux 當中著名的 “wget” 指令下載已經給予公開權限的 Google 雲端硬碟檔案。現在這篇文章,則是打算紀錄起 Python 當中可以用來下載 Google 雲端硬碟檔案的套件 “gdown”。

Read More »[Python] 使用 gdown 套件來下載 Google 雲端硬碟的檔案

[Python] 使用 pytrends 套件獲取 Google 搜尋趨勢的結果

『Google 搜尋趨勢』(Google Trends)是由 Google 提供的線上搜尋趨勢服務 (https://trends.google.com/trends/trendingsearches/daily),可以簡單地看出最近哪些『關鍵字』是熱門的。有時候,除了 Google 新聞 (Google News) 外,我也會看看 Google 搜尋趨勢,看看最近是否有熱門的事情發生。 (不過打開一看,最近滿滿的都是『武漢肺炎』…… 看來災情真的很嚴重啊,願所有人平安。)

Read More »[Python] 使用 pytrends 套件獲取 Google 搜尋趨勢的結果

[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)

Gensim 介紹

在自然語言處理 (NLP) 的任務中,純文字的資料型態本身是相當難以進行處理的,尤其是在機器學習的任務當中。

試想:今天我們輸入圖像進行分類的訓練,我們可以使用『像素值』代表圖片的特徵進入模型當中進行訓練。但是文字呢?

Read More »[Python] 使用 Gensim 套件將文字轉成向量(Word2Vec)