[PyTorch] LSTM 的原理與輸入輸出格式紀錄
LSTM (Long Short-Term Memory),中文翻譯做『長短期記憶』,是一種循環神經網路 (RNN)。其論文發表於 1997 年,是在自然語言處理當中非常重要、並且好用的模型層。
Read More »[PyTorch] LSTM 的原理與輸入輸出格式紀錄LSTM (Long Short-Term Memory),中文翻譯做『長短期記憶』,是一種循環神經網路 (RNN)。其論文發表於 1997 年,是在自然語言處理當中非常重要、並且好用的模型層。
Read More »[PyTorch] LSTM 的原理與輸入輸出格式紀錄雖然僅僅只是個人體感,不過我認為在使用 PyTorch 的過程中,最容易遇到的報錯有兩個 —— 一個是模型的 ""Mismatch、另外一個就是我今天所紀錄的:
Read More »[已解決][PyTorch] RuntimeError: Expected object of scalar type Float but got scalar type Long for argument今天,我在使用 PyTorch 搭建 LSTM 模型的時候發生了以下這樣的報錯:
LSTM RuntimeError: input must have 3 dimensions, got 2
Read More »[已解決][PyTorch] LSTM RuntimeError: input must have 3 dimensions, got 2今天,我在使用 PyTorch 讀取一個已經訓練好的模型進行全新資料的分類時,意外地遇到了以下這個報錯:
RuntimeError: Input and parameter tensors are not at the same device, found input tensor at cuda:1 and parameter tensor at cuda:0
Read More »[已解決] RuntimeError: Input and parameter tensors are not at the same device, found input tensor at cpu and parameter tensor at cuda:0在我們使用 PyTorch 這個著名的 Python 深度學習框架時,若能夠將我們建構的模型視覺化呈現出來,那就再好不過了。
Read More »[PyTorch] 使用 torchsummary 將模型視覺化今天,在我使用 PyTorch 搭建模型時,突然間有了需要提交技術報告的需求 (?),於是乎我簡單地找了下將模型視覺化的工具: torchviz。
Read More »[已解決] graphviz.backend.ExecutableNotFound: failed to execute ['dot', '-Tpdf', '-O', 'Digraph.gv'], make sure the Graphviz executables are on your systems' PATH今天我在使用 PyTorch 搭建一個簡單的分類器時,遇到了一個這樣的報錯: "RuntimeError: CUDA error: device-side assert triggered"。依稀記得從前也遇過這樣的問題,但也忘記怎麼解決的了,畢竟從前其實沒有記筆記的習慣。
Read More »[已解決] RuntimeError: CUDA error: device-side assert triggered接續之前旅館評論分類的工作,詳情請參閱《[PyTorch] 旅館評論情感分析實戰紀錄 (0)》這篇文章,我再次對原本的分類模型進行了簡單的改良。至於改良了什麼呢?還記得我在上一篇文章中提到我只是胡亂地將每個字斷開,個別給相異字一個 Index 去代表該字——簡單來講,就只是把文字資料轉成單個數字,好用來進行 Machine Learning。
Read More »[PyTorch] 旅館評論情感分析實戰紀錄 (1)Read More »[PyTorch] 旅館評論情感分析實戰紀錄 (0)『旅館評論情感分析』是一個適合訓練分類模型的自然語言處理(NLP)任務。今天是我隨意開始嘗試的第一天,於是我找了個 GitHub 上的旅館評論資料集專案,並訓練了一個由全連接層(fully-connected layer)組成的分類模型,並以 accuracy、precision、recall、F1-score 作為我的指標分數評估模型好壞。
在使用 PyTorch 這個好用的 Python 深度學習框架進行模型的訓練時,常常會有剛學習的人忘記把訓練好的模型『儲存』起來 —— 甚至根本沒意識到這回事,以為每次要使用都必須訓練一次。(其實這是我的黑歷史 XDDD)
Read More »[PyTorch] 如何儲存模型、讀取模型