Python

[Python] 值得參考的 Coding Style 整理筆記

Clay
2020-07-232021-07-25
1 Comment
Python

最近有個比較大一點的個人專案準備收尾，並準備交接給朋友接手，看他後續想要新增什麼樣的功能。有鑑於此，我開始考慮是否將程式碼做個徹底的整理。

Clay
2020-07-172021-07-24
Machine Learning, Python, Scikit-Learn

Cross-validation (交叉驗證) 是機器學習中『切割資料』的一個重要的觀念。簡單來說，當我們訓練一個模型時，我們通常會將資料分成『訓練資料』(Training data) 和『測試資料』(Test data)，然後我們使用訓練資料訓練模型、並使用模型從來沒見過的測試資料評估模型的好壞。

Clay
2020-07-152021-07-24
Machine Learning, Python, PyTorch

在我們使用 PyTorch 搭建 RNN 與其各種變體 (比如 LSTM、GRU) 的模型時，若搭配 PyTorch 所提供的 Embedding 層當作模型第一層的嵌入層，那麼，我們經常會碰到不同長度序列的文章。

Clay
2020-07-142021-07-24
NLP, Python

之前我曾經紀錄過，如何使用 Python 的 Gensim 套件訓練一個 Word2Vec 模型，讓我們將『詞彙』轉成『向量』，而這些轉成的『向量』也並不是毫無道理，直觀理解上，是每一維度中包含著文本中的一個隱含主題 —— 至少人們是這樣希望模型學習到東西的。

Clay
2020-07-132021-07-24
Machine Learning, Python, PyTorch

問題描述

今天，當我在嘗試著自己使用 nn.Embedding() 拼接並計算句向量的時候，我在自己預先準備的 DataLoader 上得到了這樣的一個報錯：

Clay
2020-07-062023-06-01
Machine Learning, Python, PyTorch

今天我在查看 Hugging Face 的 Transformers 套件官方 Document 時，赫然發現一個恐怖的事情 —— 使用 Transformers 時所調用的 from_pretrained()，在讀取預訓練進來的時候，整個模型的狀態是屬於 eval() 、也就是評估模式的。

Clay
2020-07-052021-10-13
Machine Learning, NLP, Python, PyTorch

使用 PyTorch 搭建關於自然語言處理相關任務的人，想必都對 PyTorch 當中的 nn.Embedding() 不陌生。nn.Embedding() 是 PyTorch 當中的一個嵌入層，可以讓我們將不同的詞編號之後放入，並產生一組我們可以任意指定的向量回傳。

Clay
2020-07-042021-07-21
Packages, Python

什麼是 JPEG 2000

JPEG 2000、也就是本文標題的 JP2，是一種圖片檔案的格式，副檔名即為 .jp2。基本上，JP2 的『壓縮比』比一般熟悉的 JPEG 來得更好。

Clay
2020-07-022021-07-21
Machine Learning, Python, PyTorch

在我們使用 PyTorch 搭建模型來處理我們深度學習的任務的時候，有時候我們會面臨需要『重複定義不同模型層』的情況，有時候這是很讓人煩躁的，尤其是必須毫無必要地寫一大堆都是複製貼上的程式碼。

Clay
2020-07-012021-07-11
NLP, Python

埋首於自然語言處理 (NLP) 工作的人們，想必都對 Glove 和 Gensim 不陌生。

« 上一頁
1
...
28
29
30
31
32
...
50
下一頁 »

Python

[Python] 值得參考的 Coding Style 整理筆記

[Python] 使用 ShuffleSplit() 進行 cross-validation

[PyTorch] 如何使用 pad_packed_sequence 和 pack_padded_sequence 調整可變長度序列批次

[NLP][Python] 表示文件向量： Doc2Vec

[已解決][PyTorch] TypeError: expected Tensor as element 0 in argument 0, but got list

問題描述

[PyTorch] 確認模型的狀態屬於 train() 或是 eval()

[PyTorch] nn.Embedding() 讀取 Gensim 預訓練模型權重方法筆記

[Python] 使用 OpenCV 轉換 JP2 格式的圖片成 PNG、JPEG

什麼是 JPEG 2000

[PyTorch] 使用 ModuleList 減少重複定義模型的程式碼數量

[Python] 將 Glove 模型轉換成 Gensim 可以讀取的格式

2026 年 6 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30