Skip to content

29 8 月, 2024

使用 Microsoft BIPIA 框架評估 LLM 防禦能力

Last Updated on 2024-08-30 by Clay

現在 LLM 的服務已經涵蓋了各式各樣的領域,而提示注入Prompt Injection)和越獄Jailbreak)對 LLM 的威脅也是與日俱增,幾個月前甚至有客服 LLM 給了客戶錯誤的資訊導致權益受損呢(雖然那不是 Prompt 攻擊造成的)。

而 Microsoft 所開源的 BIPIABenchmarking and Defending Against Indirect Prompt Injection Attacks on Large Language Models)評估方法,雖然已經是半年前的測試了,到現在也沒什麼大更新,但是應用在我手邊的任務中,仍不失為一個方便簡潔的測試方法。

Read More »使用 Microsoft BIPIA 框架評估 LLM 防禦能力