[PyTorch] 保存優化器(optimizer)來接續訓練模型
我一直以來都希望能夠保存 PyTorch 訓練模型時所使用的優化器(optimizer),以便能夠在模型結束訓練之後,繼續往下訓練;一般來說,如果是要做遷移學習、微調模型(fine-tune),那麼並不需要特別將上一次訓練的優化器保存下來。
Read More »[PyTorch] 保存優化器(optimizer)來接續訓練模型我一直以來都希望能夠保存 PyTorch 訓練模型時所使用的優化器(optimizer),以便能夠在模型結束訓練之後,繼續往下訓練;一般來說,如果是要做遷移學習、微調模型(fine-tune),那麼並不需要特別將上一次訓練的優化器保存下來。
Read More »[PyTorch] 保存優化器(optimizer)來接續訓練模型最早切身體會到 AI 的強大,是在 AlphaGo 第一次贏了曾是世界圍棋第一人的李世石老師的時候。我從小就嚮往著成為圍棋職業棋士,也花費了許多功夫鑽研棋盤上的競技之道,更重要的是,我從小就是李世石老師的棋迷,幾乎所有從以前認識我的棋界朋友都可以作證 XD…… 於是,在 AlphaGo 擊敗李世石老師的時候,我吃驚到彷彿自己的價值觀都被顛覆了一般。
Read More »[Machine Learning] 機器學習筆記-0 基本介紹CodeBERT 這一預訓練模型(pre-trained model)提出自《CodeBERT: A Pre-Trained Model for Programming and Natural Languages》。
Read More »[Machine Learning] CodeBERT 使用方法與介紹(附範例程式碼)aitextgen 是一個封裝得很高級的 Python 套件,讓使用者只需要寫短短幾行的程式碼,便能設定好複雜的 AI 模型。它的架構採用了 OpenAI’s GPT-2 和 EleutherAI’s GPT Neo/GPT-3,也能使用預訓練模型(pre-trained model)繼續進行模型的微調。
Read More »[NLP] 使用 aitextgen 套件來生成文本平均絕對誤差(Mean Absolute Error, MAE)是一個非常有名且基礎的評估指標,通常會出現在機器學習入門課的第一堂課、或第 N 堂 —— 這須視乎你的老師怎麼安排教材。不過對我而言,它就像瑪利歐在關卡 1-1 出發後的第一隻蘑菇怪一樣的存在。
Read More »[Machine Learning] MAE 指標介紹與程式實作Symmetric Mean Absolute Percentage Error(SMAPE),中文可以翻譯成『對稱性平均絕對百分比誤差』,是一種經典的『預測值與實際值』的評估指標。
Read More »[Machine Learning] SMAPE 指標介紹與程式實作今天在執行以 Tensorflow 作為後端的 Keras 程式時,意外發生了以下報錯訊息:
Read More »[已解決] Exception ignored in: bound method BaseSession.__del__ of tensorflow.python.client.session.Session object at 0x7ff1243e0358過去我幾乎沒有使用 Weka 的經驗,但在因緣際會下,我有緣接觸了 Weka 這項適用於資料探勘、機器學習領域的工具,於是便簡單地紀錄在這裡。
Read More »安裝資料探勘、機器學習工具 Weka 筆記搭建深度學習環境一直都不是一項簡單的事情,尤其是相當主流的 Nvidia 顯卡和 Tensorflow 的組合,其中版本的問題以及需要額外安裝的驅動、CUDA、cuDNN 就夠讓人頭疼了。而且主流的作業系統是 Linux 而非 Windows ,可以發現教學文明顯就少了些。
Read More »[Deep Learning] 在 Windows 上搭建 Tensorflow、CUDA、cuDNN 的訓練環境