[Python] 字串全形半形轉換方式
前言
使用 Python 進行自然語言處理(NLP)的任務是在機器學習、深度學習領域相當常見的事情,當然,針對文本的前處理所需具備的工具、函式庫自然也是一應俱全。
使用 Python 進行自然語言處理(NLP)的任務是在機器學習、深度學習領域相當常見的事情,當然,針對文本的前處理所需具備的工具、函式庫自然也是一應俱全。
在做資料處理的過程中,經常會有需要將特定 column 的值做替換的步驟。可能是處理 missing value、可能是將錯誤的數值刪除...... 當然,Python 有眾多的工具、套件、函式可以來進行常見的取代任務。不過,總難免會有需要特殊處理的情況。
Read More »[Python] 如何取代 Pandas DataFrame 中特定 column 內的值Simple Transformers 是一個 Python 的 NLP 套件/框架,旨在減少使用 Transformer 模型時的複雜步驟。能夠讓使用者透過短短幾行的程式碼,快速實現一個 NLP 任務的深度學習模型訓練環境。
Read More »Simple Transformers (1) - 基本介紹今天在我使用 Anaconda 啟用 Python 的環境時,我得到了以下錯誤訊息,導致無法進入虛擬環境。
Read More »[已解決] CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'. To initialize your shell, run...今天當我透過 simpletransformers 套件訓練模型時,我得到了一個我之前沒碰過的警告訊息:
Read More »[已解決] huggingface/tokenizers: The current process just got forked. after parallelism has already been used. Disabling parallelism to avoid deadlocksGiven an integer array nums
, you need to find one continuous subarray that if you only sort this subarray in ascending order, then the whole array will be sorted in ascending order.
Given an integer array nums
, move all the even integers at the beginning of the array followed by all the odd integers.
Given two strings s
and t
, return true
if they are equal when both are typed into empty text editors. '#'
means a backspace character.
最近當我重新配置工作用環境的 Nvidia GPU 驅動程式時,當我安裝過後重新開機,我卻無法透過 nvidia-smi
指令去取得 GPU 的資訊。唯一得到的訊息是:
T5 ,全名是 Transfer Learning with a Unified Text-to-Text Transformer,在 2019 年底提出、隔年 2020 年則在 GLUE 上成為榜首,成功擠下了自家的 ALBERT。
Read More »[Machine Learning] T5 預訓練模型學習筆記