Skip to content

9 月 2024

[Linux] 透過高頻率自動推測你想前往的資料夾:z 指令

Last Updated on 2024-09-16 by Clay

簡介

z 指令我想寫很久了!只是手邊一直在忙 AI 的訓練(公司業務)跟模型架構的加速推理(個人興趣),所以一直沒能騰出手來寫。這樣說好了,如果有人讓我推薦 Linux 系統必裝的工具,我會毫不猶豫地選擇 z 在我前十大推薦清單中。

Read More »[Linux] 透過高頻率自動推測你想前往的資料夾:z 指令

vLLM 加速推理框架中使用整合之 Outlines 工具進行解碼約束

Last Updated on 2024-09-06 by Clay

最近把不少 Outlines 的應用整合進了我當前工作流程中,其中我最常與 vLLM 一起使用的,不過其說明文件不知為何在 vLLM GitHub 上一直沒被 merge,所以我在設計流程時不得不一直拿一個被 rejected 的 PR 原始碼在看說明 XD

Read More »vLLM 加速推理框架中使用整合之 Outlines 工具進行解碼約束

使用有限狀態機約束大型語言模型解碼之實作

Last Updated on 2024-09-04 by Clay

本篇為一簡單 Python 實作,用於測試有限狀態機Finite-State Machine)約束大型語言模型Large Language Model)解碼出特定格式的回答,也權當作是理解 Outlines 工具的理念。當然,我實作的部份跟 Outlines 工具相比,實在顯得太過簡易。

Read More »使用有限狀態機約束大型語言模型解碼之實作

使用 Outlines 工具結構化模型的輸出

Last Updated on 2024-09-02 by Clay

在將大型語言模型(Large Language Model, LLM)應用於實際場景時,經常不僅僅是讓模型自由發揮、任意生成文句 —— 我們也可能會希望模型返回特定的結構,比方說做選擇題、或是給一個評分。在這樣的情況下,transformers 架構的模型可以直接使用 outlines 這個工具。

Read More »使用 Outlines 工具結構化模型的輸出