Skip to content

30 7 月, 2024

使用文字檢索圖像: ColPali 多模態模型簡介

Last Updated on 2024-07-31 by Clay

介紹

從去年開始我就對多模態Multi-Modal)的 AI 模型充滿了熱忱與好奇,因為我是堅定不移的 AGI 派,認為 AI 目前的潛力仍然遠遠沒有抵達天花板;而 AI 當前的一大瓶頸與研究方向,自然就是整合了多種不同的模態(文字、圖像、音訊...)的模型應用了。

Read More »使用文字檢索圖像: ColPali 多模態模型簡介