Clay

[Python] 使用 httpx 取代 requests 進行異步請求

Clay
2024-07-282024-07-28
Python

在 Python 的程式開發中，我們經常使用 requests 模組進行 HTTP 請求；然而 requests 在真正串連前後端及不同服務時其同步請求方式可能成為瓶頸，我最近正是因為使用 requests 造成 K8s 的探針阻塞、進而導致所開發的服務容器被誤刪 —— 此時，httpx 可能是一個更適合的異步請求操作模組。

Stable Diffusion ComfyUI 筆記 03 – 下載各種可以使用的模型

Clay
2024-07-272024-08-12
AI

在使用 ComfyUI 生成圖片時，我們得借助各式各樣模型的能力，最終才能兜出一個完整的工作流；換句話說，這些所謂『各式各樣的模型』，加總在一起，才是所謂的 Stable Diffusion。而今天，我要介紹可以去哪裡下載到這些模型。

Stable Diffusion ComfyUI 筆記 02 – 基本的工作流

Clay
2024-07-262024-07-31
AI

介紹

上一回我們完成了 ComfyUI 的配置，現在我們可以開始建立一個最基本的工作流（workflow）。工作流是 ComfyUI 跟 stable-diffusion-webui 最不同的地方，ComfyUI 藉由不同卡片之間組成的流程，更容易讓人明白實際上 Stable Diffusion 的模型究竟是怎麼推理的、也更容易客製化做出更進階的效果。

Stable Diffusion ComfyUI 筆記 01 – 下載與環境安裝

Clay
2024-07-242024-07-27
AI

什麼是 ComfyUI？

有在玩 Stable Diffusion AI 生圖的人可能都聽過 stable-diffusion-webui，它是一個支援 Stable Diffusion 模型架構的視覺化界面，讓使用者可以不必親自撰寫程式碼或是繁瑣的命令列操作，就可以讓 AI 模型進行生圖的推理。而 ComfyUI 則是另外一個稍微小眾一點的前端界面，不過憑著自由且能靈活客製化的特性，也迅速地收割了一波死忠的粉絲，基本上，可以視為是 stable-diffusion-webui 的更進階版本，也比較沒那麼親民。

PaddleOCR: 擅長中文光學字元辨識（OCR）的架構與模型

Clay
2024-07-202024-07-20
Machine Learning, Python

介紹

最近我在探索一些用來進行光學字元辨識（Optical character recognition, OCR）的模型，早些年 OCR 是研究非常熱門的領域，畢竟是電腦視覺最早可落地應用的領域；但是到了今日，OCR 也已經是非常成熟的任務了，上網一找，便可以找到性能很好的開源模型。

NuExtract: 使用大型語言模型進行資訊萃取

Clay
2024-07-092024-07-09
Machine Learning

介紹

在如今各種大型語言模型百花齊放的時代，各方研究者與企業都絞盡腦汁，想辦法將大型語言模型應用在手邊的工作中；但說句我個人的心裡話，現今各種語言模型的性能仍舊不夠強，其應用的場景很少，許多時候是遠遠比不上人類的。

但有一種任務類型是大型語言模型天生就相當合適的：任意場景的資訊萃取，也即是我今天想介紹的 NuExtract 模型。

[Machine Learning] SiLU 激活函數筆記

Clay
2024-06-062024-06-06
Machine Learning, PyTorch

介紹

SiLU （Sigmoid Linear Unit）激活函數，跟 Swish 函數十分相像，只差在一個可訓練的 beta 係數，現今也有許多大型語言模型（LLM）採用，主要是在一些探索使用非 ReLU 等激活函數的大型語言模型上，比方說經典的 Llama 架構。

Unsloth 加速微調開源項目筆記

Clay
2024-06-042024-06-04
Machine Learning, Python

介紹

這幾個月以來我一直受到 Unsloth 這個項目的照顧，主要是因為我的工作會有很大的一部分牽涉到大型語言模型（LLM）的微調，而微調 LLM 是非常耗時的，除了收集資料外最大的時間成本就是在永無止境地透過 GPU 微調模型。

[論文解讀] Kangaroo: Lossless Self-Speculative Decoding via Double Early Exiting

Clay
2024-06-032024-11-26
Machine Learning, Python

前言

這是華為諾亞方舟實驗室所提出加速框架，本質上是把原先投機解碼（speculative decoding）中所使用的小模型由大模型的淺層網路取代，並再由額外訓練的適配器（adapter）加上模型本身的解碼頭去生成推測的 token，再由大模型去進行驗證，並在拒絕推測 token 時由大模型所生成的機率分佈解碼結果取代 —— 這些操作與原先的 speculative decoding 其實沒有太大差別。

RESTful 筆記（附 Python FastAPI + CURL 範例）

Clay
2024-06-022024-06-02
Linux, Python

介紹

RESTful 設計風格（Representational State Transfer, REST）是一種用於設計網路應用程式的架構風格。它遵守著讓網路應用程式更加簡潔、可擴展和易於維護的準則去設計。

« 上一頁
1
...
6
7
8
9
10
...
108
下一頁 »

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30