Skip to content

AI

使用 Outlines 工具結構化模型的輸出

在將大型語言模型(Large Language Model, LLM)應用於實際場景時,經常不僅僅是讓模型自由發揮、任意生成文句 —— 我們也可能會希望模型返回特定的結構,比方說做選擇題、或是給一個評分。在這樣的情況下,transformers 架構的模型可以直接使用 outlines 這個工具。

Read More »使用 Outlines 工具結構化模型的輸出

使用 Microsoft BIPIA 框架評估 LLM 防禦能力

現在 LLM 的服務已經涵蓋了各式各樣的領域,而提示注入Prompt Injection)和越獄Jailbreak)對 LLM 的威脅也是與日俱增,幾個月前甚至有客服 LLM 給了客戶錯誤的資訊導致權益受損呢(雖然那不是 Prompt 攻擊造成的)。

而 Microsoft 所開源的 BIPIABenchmarking and Defending Against Indirect Prompt Injection Attacks on Large Language Models)評估方法,雖然已經是半年前的測試了,到現在也沒什麼大更新,但是應用在我手邊的任務中,仍不失為一個方便簡潔的測試方法。

Read More »使用 Microsoft BIPIA 框架評估 LLM 防禦能力

[論文閱讀] Lifting the Curse of Multilinguality by Pre-training Modular Transformers

Cross-lingual Modular (X-Mod) 是一個有趣的語言模型架構,透過模組化不同語言的參數作為模組單元Module Unit)組裝在模型中,好讓語言模型在新增全新語言時,可以使用獨立的參數進行微調,而(比較)不會出現災難性遺忘的窘境。

Read More »[論文閱讀] Lifting the Curse of Multilinguality by Pre-training Modular Transformers

使用文字檢索圖像: ColPali 多模態模型簡介

介紹

從去年開始我就對多模態Multi-Modal)的 AI 模型充滿了熱忱與好奇,因為我是堅定不移的 AGI 派,認為 AI 目前的潛力仍然遠遠沒有抵達天花板;而 AI 當前的一大瓶頸與研究方向,自然就是整合了多種不同的模態(文字、圖像、音訊...)的模型應用了。

Read More »使用文字檢索圖像: ColPali 多模態模型簡介

Meta-llama--Prompt-Guard-86M: 提示防護的開源模型,偵測惡意攻擊 Prompt

Meta AI 在近期開放了 Llama 3.1 的各種量級(405B、70B、8B),尤其是 405B 更是引人注目,可謂是開源的 LLM 第一次追上了如 GPT-4、Claude-3.5 等閉源的大型語言模型。而與此同時,Meta AI 也開源了一個小模型 Prompt-Guard-86M

Read More »Meta-llama--Prompt-Guard-86M: 提示防護的開源模型,偵測惡意攻擊 Prompt

Stable Diffusion ComfyUI 筆記 02 - 基本的工作流

介紹

上一回我們完成了 ComfyUI 的配置,現在我們可以開始建立一個最基本的工作流workflow)。工作流是 ComfyUI 跟 stable-diffusion-webui 最不同的地方,ComfyUI 藉由不同卡片之間組成的流程,更容易讓人明白實際上 Stable Diffusion 的模型究竟是怎麼推理的、也更容易客製化做出更進階的效果。

Read More »Stable Diffusion ComfyUI 筆記 02 - 基本的工作流

Stable Diffusion ComfyUI 筆記 01 - 下載與環境安裝

什麼是 ComfyUI?

有在玩 Stable Diffusion AI 生圖的人可能都聽過 stable-diffusion-webui,它是一個支援 Stable Diffusion 模型架構的視覺化界面,讓使用者可以不必親自撰寫程式碼或是繁瑣的命令列操作,就可以讓 AI 模型進行生圖的推理。而 ComfyUI 則是另外一個稍微小眾一點的前端界面,不過憑著自由且能靈活客製化的特性,也迅速地收割了一波死忠的粉絲,基本上,可以視為是 stable-diffusion-webui 的更進階版本,也比較沒那麼親民。

Read More »Stable Diffusion ComfyUI 筆記 01 - 下載與環境安裝