[已解決] UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero. (Triggered internally at …/c10/cuda/CUDAFunctions.cpp:109.) return torch._C._cuda_getDeviceCount() > 0
問題描述
今天我在我的伺服器訓練模型時,我寫好了一份多片 GPU 平行化訓練的腳本,接著把最新的資料輸入給模型開始訓練;但是在訓練過程中,我得到了沒有 GPU 的錯誤訊息。當我使用 torch.cuda.is_available()
確認時,得到了以下錯誤訊息。