Last Updated on 2024-01-07 by Clay
什麼是 Ray?
Ray 是一個開源的分散式計算框架,主要是針對 AI 與 Python 應用程式的擴展。Ray 提供了用於平行處理的高級封裝界面,讓開發者不用成為分散式系統專家也能順利建構自己的 AI 系統。
而我在現在的工作上(現職的 AI 工程師),也需要使用到 Ray 來讓 AI 模型能夠順利地從研究端走向產品端。所以這是個好機會,我決定在此留下關於 Ray 的筆記。這些筆記不會是 Ray 文檔的直接翻譯,而是會換成我自己的話來說出我該怎麼使用,好方便我日後可以隨時重溫這些筆記。當然,若能幫助到也想要學習 Ray 的有緣讀者,那就更是再好不過了。
在我落筆的此刻(2024/01/07),Ray 的官方文件有幾個核心章節:
- Ray Core
- Ray Data
- Ray Train
- Ray Tune
- Ray Serve
- Ray RLib
- Ray Clusters
但我會首先從 Ray Serve 開始撰寫,畢竟這也是我現在工作上會接觸到的部份。其他想必也同樣優秀的章節,就留待日後有緣。
Ray Serve
- Getting Start
- Key Concepts
- Develop and Deploy an ML Application
- Deploy Compositions of Models
- Deploy Multiple Applications
- Model Multiplexing
- Configure Ray Serve deployments
- Set Up FastAPI and HTTP
- Production Guide
- Monitor Your Application
- Resource Allocation
- Ray Serve Autoscalling
- Advanced Guides
- Architecture
- Examples
- Ray Serve API