[NLP] 使用 aitextgen 套件來生成文本
aitextgen 是一個封裝得很高級的 Python 套件,讓使用者只需要寫短短幾行的程式碼,便能設定好複雜的 AI 模型。它的架構採用了 OpenAI's GPT-2 和 EleutherAI's GPT Neo/GPT-3,也能使用預訓練模型(pre-trained model)繼續進行模型的微調。
Read More »[NLP] 使用 aitextgen 套件來生成文本aitextgen 是一個封裝得很高級的 Python 套件,讓使用者只需要寫短短幾行的程式碼,便能設定好複雜的 AI 模型。它的架構採用了 OpenAI's GPT-2 和 EleutherAI's GPT Neo/GPT-3,也能使用預訓練模型(pre-trained model)繼續進行模型的微調。
Read More »[NLP] 使用 aitextgen 套件來生成文本平均絕對誤差(Mean Absolute Error, MAE)是一個非常有名且基礎的評估指標,通常會出現在機器學習入門課的第一堂課、或第 N 堂 —— 這須視乎你的老師怎麼安排教材。不過對我而言,它就像瑪利歐在關卡 1-1 出發後的第一隻蘑菇怪一樣的存在。
Read More »[Machine Learning] MAE 指標介紹與程式實作Symmetric Mean Absolute Percentage Error(SMAPE),中文可以翻譯成『對稱性平均絕對百分比誤差』,是一種經典的『預測值與實際值』的評估指標。
Read More »[Machine Learning] SMAPE 指標介紹與程式實作今天在執行以 Tensorflow 作為後端的 Keras 程式時,意外發生了以下報錯訊息:
Read More »[已解決] Exception ignored in: bound method BaseSession.__del__ of tensorflow.python.client.session.Session object at 0x7ff1243e0358過去我幾乎沒有使用 Weka 的經驗,但在因緣際會下,我有緣接觸了 Weka 這項適用於資料探勘、機器學習領域的工具,於是便簡單地紀錄在這裡。
Read More »安裝資料探勘、機器學習工具 Weka 筆記搭建深度學習環境一直都不是一項簡單的事情,尤其是相當主流的 Nvidia 顯卡和 Tensorflow 的組合,其中版本的問題以及需要額外安裝的驅動、CUDA、cuDNN 就夠讓人頭疼了。而且主流的作業系統是 Linux 而非 Windows ,可以發現教學文明顯就少了些。
Read More »[Deep Learning] 在 Windows 上搭建 Tensorflow、CUDA、cuDNN 的訓練環境Early stopping 是一種應用於機器學習、深度學習的技巧,正如字面上的意思 —— 較早地停止。在進行監督式學習的過程中,這很有可能是一個找到模型收斂時機點的方法。
Read More »[PyTorch] 應用 Early stopping 技術讓模型在較好的收斂時間點停止訓練在使用 PyTorch 搭建深度學習環境的時候,若是我們有著切割資料集的需求(比方說將訓練資料切出驗證資料),在將資料封裝成 PyTorch 的 dataset 物件時,我們便可以透過 PyTorch 內建的切割函式 —— random_split()
來做到切割資料集。
PyTorch 是一個經常用於架構深度學習的框架,從名字就可以看出,是使用 Python 語法來調用的。PyTorch 封裝了各式各樣常用於深度學習的函式、神經網路、模型架構,使用上非常方便。
Read More »[PyTorch] 設置種子參數重現模型訓練結果