[Python] 使用 python-pptx 套件抽取 PPT 中的文字
Introduction
最近在處理一些工作上的事情時,發現客戶可能有潛在性的『需要從 PPT 中抽取文字』的需求 —— 我詢問過 PM 和主管,他們表示讓客戶自己手動複製 PPT 簡報中的文字出來就好。除非客戶有想到,然後對我們提出使用程式抽取出來的要求。
Read More »[Python] 使用 python-pptx 套件抽取 PPT 中的文字最近在處理一些工作上的事情時,發現客戶可能有潛在性的『需要從 PPT 中抽取文字』的需求 —— 我詢問過 PM 和主管,他們表示讓客戶自己手動複製 PPT 簡報中的文字出來就好。除非客戶有想到,然後對我們提出使用程式抽取出來的要求。
Read More »[Python] 使用 python-pptx 套件抽取 PPT 中的文字我們經常會在機器學習中聽到 『KL 散度』(Kullback Libler Divergence)這個詞,而 KL 散度其實就是評估兩個機率分佈 P 和 Q 之間『差異性』的一個評估值。
Read More »[Machine Learning] KL 散度(Kullback-Leibler Divergence)筆記在 FastAPI 官方文件中,有一段關於『自動生成交互式文件』的說明:
yield
是 Python 中的一個關鍵字,它的使用場景與 return
很像,不過使用 yield
會把函式變成一個生成器(generator)。
Podman 是一個專用來管理容器(container)和鏡像(image)的開源工具,全名為 Pod Manager tool (podman)。Podman 是一個與 docker 相似的工具,但是設計上有一些小區別。
Read More »[Linux] podman 基礎指令筆記FastAPI 是一個現代、高效的 Python web 框架。基於 python 3.7+ 並且擁有 python type hints。
Read More »[Python] 使用 FastAPI 框架進行後端開發筆記duf
是一款可以在 Linux 系統上較為有『圖形化表達』的硬碟空間使用狀況檢查工具,名字取自 Disk Usage/Free Utility。順帶一提,這項工具其實不僅在 Linux,在 MacOS 和 Windows 上也都可以安裝哦。
在研究一些 AI 模型的時候,或許是研究所時保留下來的習慣,我總是會去翻翻模型、系統、套件相關的論文,就算只是粗略掃過 Abstract、Introduction、Conclusion 以及圖表也好,至少我能對我正在使用什麼東西、這東西背後是怎麼驅動的有個底,不是只會直接把開發團隊附上的程式碼跑起來就好。
Read More »Consensus: 使用 AI 驅動的論文搜尋引擎前陣子閱讀了不少 LLaMA 的各種 LoRA 模型訓練(雖然已經大概是兩個月前...),在閱讀各家程式碼的時候,發現在程式碼中設定給予模型的 prompt 時,若需要根據不同的資料調整內容,使用 format_map()
的格式看起來最為乾淨。