[Python] split() 和 splitlines() 函式的使用方法
在 Python 中,我們若是想要將一段文本依照『特定字元』來切割,讓文本變成一段段的 List 資料型態儲存著,我們可以簡單地使用 split() 這個函式來完成。
Read More »[Python] split() 和 splitlines() 函式的使用方法在 Python 中,我們若是想要將一段文本依照『特定字元』來切割,讓文本變成一段段的 List 資料型態儲存著,我們可以簡單地使用 split() 這個函式來完成。
Read More »[Python] split() 和 splitlines() 函式的使用方法FastText 是由 Facebook AI Research Lab (FAIR) 所開發的『詞嵌入』以及『文本分類』,支援 294 種語言,並且使用類神經網路訓練詞嵌入模型。
Read More »[NLP][Python] 使用 FastText 訓練詞向量一直以來,我都想要寫一篇爬蟲的心得文,描述下 Regular Expression、IP 設置、User-Agent ...... 等等經常會用到的各種工具或小知識。一方面是因為當初寫 Blog 的初衷便是想要紀錄下自己學習的過程、一方面則是因為現在花了很多時間進行爬蟲的工作,怕將來若是比較少做,就會慢慢淡忘現在比較熟練的爬蟲技能。
Read More »[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲一直以來,除非只是要寫個簡單的測試、或是單個腳本、統計程式......否則我一向都會為了自己正在寫的專案建立 Python 的虛擬環境。
Read More »[Python] 如何在資料夾中建立 Python 虛擬環境一直以來,我都覺得終端機上顯示的檔案排序跟顏色不是很好看。當然一部份是我自己管理得不夠徹底,不過我老是在想有沒有一個好的方法可以將終端機內的檔案上色、並且依照檔案類型排序呢?
Read More »[Linux] 終端機依照不同檔案顯示不同顏色、 ls 依照檔案類型排序在使用 Python 進行資料分析的時候,尤其是在進行自然語言處理 (NLP) 的任務時,我們很難避免跟一些過大的檔案打交道。但是我們的資料若是太大、大到我們一次全部載入記憶體便會發生報錯,那麼我們究竟該怎麼處理這些太大的檔案呢?
Read More »[Python] 使用 open() 開啟大檔案時避免記憶體錯誤的方法在使用 VIM 編輯器進行程式撰寫的過程中,我們一定都會需要『複製』、『貼上』這樣的功能。應該說很多時候寫程式都有一套模板,我們可能需要針對當前不同的任務客製化我們先前寫好的模板。在這樣的需求下,我們一定會需要『複製』、『貼上』這樣的功能。
Read More »[VIM] 複製貼上——開啟系統剪貼簿的支援在使用終端機連接到遠端 Server 的時候,有時我們會很迫切地希望能夠隨時查看位於遠端的圖片,尤其是我們在進行影像處理的實驗時。
Read More »[Linux] 使用 feh 從遠端終端機上快速於本機端開啟圖片今天,在我使用 PyTorch 搭建模型時,突然間有了需要提交技術報告的需求 (?),於是乎我簡單地找了下將模型視覺化的工具: torchviz。
Read More »[已解決] graphviz.backend.ExecutableNotFound: failed to execute ['dot', '-Tpdf', '-O', 'Digraph.gv'], make sure the Graphviz executables are on your systems' PATH今天想要紀錄的是在 Linux 中要如何判斷我們裝置內的硬碟究竟是 SSD (固態硬碟)呢?還是 HDD (傳統硬碟) 呢?其實在我們將硬碟掛載在裝置上的時候,都會有留下相關資訊的文件,我們可以直接翻看。
Read More »[Linux] 判斷硬碟是否為 SSD 的方法