[Python] 字串全形半形轉換方式
前言
使用 Python 進行自然語言處理(NLP)的任務是在機器學習、深度學習領域相當常見的事情,當然,針對文本的前處理所需具備的工具、函式庫自然也是一應俱全。
使用 Python 進行自然語言處理(NLP)的任務是在機器學習、深度學習領域相當常見的事情,當然,針對文本的前處理所需具備的工具、函式庫自然也是一應俱全。
在做資料處理的過程中,經常會有需要將特定 column 的值做替換的步驟。可能是處理 missing value、可能是將錯誤的數值刪除...... 當然,Python 有眾多的工具、套件、函式可以來進行常見的取代任務。不過,總難免會有需要特殊處理的情況。
Read More »[Python] 如何取代 Pandas DataFrame 中特定 column 內的值Simple Transformers 是一個 Python 的 NLP 套件/框架,旨在減少使用 Transformer 模型時的複雜步驟。能夠讓使用者透過短短幾行的程式碼,快速實現一個 NLP 任務的深度學習模型訓練環境。
Read More »Simple Transformers (1) - 基本介紹今天在我使用 Anaconda 啟用 Python 的環境時,我得到了以下錯誤訊息,導致無法進入虛擬環境。
Read More »[已解決] CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'. To initialize your shell, run...今天當我透過 simpletransformers 套件訓練模型時,我得到了一個我之前沒碰過的警告訊息:
Read More »[已解決] huggingface/tokenizers: The current process just got forked. after parallelism has already been used. Disabling parallelism to avoid deadlocks最近當我重新配置工作用環境的 Nvidia GPU 驅動程式時,當我安裝過後重新開機,我卻無法透過 nvidia-smi
指令去取得 GPU 的資訊。唯一得到的訊息是:
T5 ,全名是 Transfer Learning with a Unified Text-to-Text Transformer,在 2019 年底提出、隔年 2020 年則在 GLUE 上成為榜首,成功擠下了自家的 ALBERT。
Read More »[Machine Learning] T5 預訓練模型學習筆記不知道大家是否常常會調整自己的終端機(terminal),好讓終端機看起來更美觀呢?
Read More »[Linux] 使用 xfce 終端機來顯示終端機背景圖片在建立 Python 函式的過程中,有時我們會傳入參數讓建立的函式去處理,或許我們還會設定該參數的預設值,讓參數在我們沒有傳入任何值的情況下,仍能以一個預設(default)值去執行函式。
Read More »[Python] 函式使用可變物件當作參數預設值存在的問題Kaggle Notebook 每週都有提供一段不算短的 GPU 加速時間,並在每週六更新。也正因為如此,比起 Google Colab 我更推薦使用 Kaggle Notebook。
Read More »[Machine Learning] 持續在 Kaggle Notebook 上訓練模型(關閉 session 也在遠端訓練)