[NLP][Python] 使用 FastText 訓練詞向量
FastText 是由 Facebook AI Research Lab (FAIR) 所開發的『詞嵌入』以及『文本分類』,支援 294 種語言,並且使用類神經網路訓練詞嵌入模型。
Read More »[NLP][Python] 使用 FastText 訓練詞向量FastText 是由 Facebook AI Research Lab (FAIR) 所開發的『詞嵌入』以及『文本分類』,支援 294 種語言,並且使用類神經網路訓練詞嵌入模型。
Read More »[NLP][Python] 使用 FastText 訓練詞向量一直以來,我都想要寫一篇爬蟲的心得文,描述下 Regular Expression、IP 設置、User-Agent ...... 等等經常會用到的各種工具或小知識。一方面是因為當初寫 Blog 的初衷便是想要紀錄下自己學習的過程、一方面則是因為現在花了很多時間進行爬蟲的工作,怕將來若是比較少做,就會慢慢淡忘現在比較熟練的爬蟲技能。
Read More »[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲一直以來,除非只是要寫個簡單的測試、或是單個腳本、統計程式......否則我一向都會為了自己正在寫的專案建立 Python 的虛擬環境。
Read More »[Python] 如何在資料夾中建立 Python 虛擬環境在使用 Python 進行資料分析的時候,尤其是在進行自然語言處理 (NLP) 的任務時,我們很難避免跟一些過大的檔案打交道。但是我們的資料若是太大、大到我們一次全部載入記憶體便會發生報錯,那麼我們究竟該怎麼處理這些太大的檔案呢?
Read More »[Python] 使用 open() 開啟大檔案時避免記憶體錯誤的方法今天,在我使用 PyTorch 搭建模型時,突然間有了需要提交技術報告的需求 (?),於是乎我簡單地找了下將模型視覺化的工具: torchviz。
Read More »[已解決] graphviz.backend.ExecutableNotFound: failed to execute ['dot', '-Tpdf', '-O', 'Digraph.gv'], make sure the Graphviz executables are on your systems' PATH今天在回答一位朋友的問題時,突然間看到朋友的程式碼中出現了 "filter()" 這個函式,並且被他詢問了為什麼那行程式碼為什麼不能跑。
Read More »[Python] filter() 函式的使用方法當我們在遠端伺服器上撰寫程式的時候,許多人都會選擇簡單直白的 VIM 編輯器來進行開發。不過 VIM 雖然開箱即用,但總是比在 IDE 當中少了不少的功能 ...... 或者應該說,除了『寫程式』這件事外,VIM 原生的環境便沒有什麼多的功能了。
Read More »[VIM] 在 VIM 中使用 YouCompleteMe 自動補完 Python 程式碼在我們使用 Python 讀取文件時、或者是我們在使用任何我們可能的編輯器打開文件時,偶爾會發生我們因為使用錯誤的編碼打開我們的文件,導致文件裡的文字呈現一片亂碼的狀態。
Read More »[Python] 使用 "chardet" 套件判斷文件的編碼今天我在使用 PyTorch 搭建一個簡單的分類器時,遇到了一個這樣的報錯: "RuntimeError: CUDA error: device-side assert triggered"。依稀記得從前也遇過這樣的問題,但也忘記怎麼解決的了,畢竟從前其實沒有記筆記的習慣。
Read More »[已解決] RuntimeError: CUDA error: device-side assert triggered今天我想要紀錄的是 pickle 這個模組。首先要說明的是,pickle 在 Python 中是相當相當有名的,它的運作方法跟 Json 有點像,都是可以壓縮資料、保存、並且隨時隨地解開我們儲存好的資料,還原我們 Python 的工作階段。
Read More »[Python] 使用 Pickle 模組保存資料(持久化數據)