使用文字檢索圖像: ColPali 多模態模型簡介
Last Updated on 2024-07-31 by Clay
介紹
從去年開始我就對多模態(Multi-Modal)的 AI 模型充滿了熱忱與好奇,因為我是堅定不移的 AGI 派,認為 AI 目前的潛力仍然遠遠沒有抵達天花板;而 AI 當前的一大瓶頸與研究方向,自然就是整合了多種不同的模態(文字、圖像、音訊...)的模型應用了。
Read More »使用文字檢索圖像: ColPali 多模態模型簡介Last Updated on 2024-07-31 by Clay
從去年開始我就對多模態(Multi-Modal)的 AI 模型充滿了熱忱與好奇,因為我是堅定不移的 AGI 派,認為 AI 目前的潛力仍然遠遠沒有抵達天花板;而 AI 當前的一大瓶頸與研究方向,自然就是整合了多種不同的模態(文字、圖像、音訊...)的模型應用了。
Read More »使用文字檢索圖像: ColPali 多模態模型簡介