[Linux] TL;DR: 使用 `tldr` 取代 `man` 指令來閱讀命令列說明手冊
man 是傳統的 UNIX/Linux 系統文件工具,但因為其顯示的文件往往十分詳細,對於只想要快速查看指令使用方式的使用者來說可能較為困擾。因此,一個精簡版本的 tldr 指令就因應而生了(too long, didn’t read 的縮寫),它專注於提供一個簡短、易於理解的命令文件。
man 是傳統的 UNIX/Linux 系統文件工具,但因為其顯示的文件往往十分詳細,對於只想要快速查看指令使用方式的使用者來說可能較為困擾。因此,一個精簡版本的 tldr 指令就因應而生了(too long, didn’t read 的縮寫),它專注於提供一個簡短、易於理解的命令文件。
很早之前我就一直在尋找 htop 的美觀替代版了,幾年前某次朋友聚會時我剛好拿出筆電連線解決實驗室 docker 意外 segmentation fault 的問題,那時朋友看到我的 htop,說了一句「好原始哦~工程師好無聊哦~」讓我記恨至今(沒有啦,開玩笑的)。
深度神經網路訓練、微調的過程中,最重要也最稀缺的資源讓我來說肯定是 GPU 的 VRAM,所以讓每一位元真正發揮它的能力是非常重要的事情。
Read More »深度學習中不同精度表示的差異 float32、float16、float8 和 bfloat16Linux 好用的工具實在太多了,真的是每個都想紀錄一番呢。為了慶祝 Linux 在 StatCounter 上紀錄的使用比例達到了 4.55%(2024-09-18),我決定再來紀錄一個同事推薦我的 fuck 指令。
z 指令我想寫很久了!只是手邊一直在忙 AI 的訓練(公司業務)跟模型架構的加速推理(個人興趣),所以一直沒能騰出手來寫。這樣說好了,如果有人讓我推薦 Linux 系統必裝的工具,我會毫不猶豫地選擇 z 在我前十大推薦清單中。
最近我透過微調 Gemma-2 獲得了一些應用的不錯結果,然而卻在佈署上客戶的設備時發生各式各樣的錯誤,搞得我焦頭爛額的,目前網路上還沒有一個比較系統化的疑難雜症排除,故紀錄於此。
Read More »使用 vLLM 在 V100 GPU 上加速推理 Gemma-2 疑難雜症排除Python 中的上下文管理器裝飾器 @contextmanager 是 contextlib 模組中的一個裝飾器,可以讓開發人員簡便地創造屬於我們的上下文管理器(Context Manager)。
最近把不少 Outlines 的應用整合進了我當前工作流程中,其中我最常與 vLLM 一起使用的,不過其說明文件不知為何在 vLLM GitHub 上一直沒被 merge,所以我在設計流程時不得不一直拿一個被 rejected 的 PR 原始碼在看說明 XD
Read More »vLLM 加速推理框架中使用整合之 Outlines 工具進行解碼約束本篇為一簡單 Python 實作,用於測試有限狀態機(Finite-State Machine)約束大型語言模型(Large Language Model)解碼出特定格式的回答,也權當作是理解 Outlines 工具的理念。當然,我實作的部份跟 Outlines 工具相比,實在顯得太過簡易。
Read More »使用有限狀態機約束大型語言模型解碼之實作