Skip to content

Ray – 深度學習分散式計算框架筆記目錄

Last Updated on 2024-01-07 by Clay

什麼是 Ray?

Ray 是一個開源的分散式計算框架,主要是針對 AI 與 Python 應用程式的擴展。Ray 提供了用於平行處理的高級封裝界面,讓開發者不用成為分散式系統專家也能順利建構自己的 AI 系統。

而我在現在的工作上(現職的 AI 工程師),也需要使用到 Ray 來讓 AI 模型能夠順利地從研究端走向產品端。所以這是個好機會,我決定在此留下關於 Ray 的筆記。這些筆記不會是 Ray 文檔的直接翻譯,而是會換成我自己的話來說出我該怎麼使用,好方便我日後可以隨時重溫這些筆記。當然,若能幫助到也想要學習 Ray 的有緣讀者,那就更是再好不過了。

在我落筆的此刻(2024/01/07),Ray 的官方文件有幾個核心章節:

  • Ray Core
  • Ray Data
  • Ray Train
  • Ray Tune
  • Ray Serve
  • Ray RLib
  • Ray Clusters

但我會首先從 Ray Serve 開始撰寫,畢竟這也是我現在工作上會接觸到的部份。其他想必也同樣優秀的章節,就留待日後有緣。


Ray Serve

  • Getting Start
  • Key Concepts
  • Develop and Deploy an ML Application
  • Deploy Compositions of Models
  • Deploy Multiple Applications
  • Model Multiplexing
  • Configure Ray Serve deployments
  • Set Up FastAPI and HTTP
  • Production Guide
  • Monitor Your Application
  • Resource Allocation
  • Ray Serve Autoscalling
  • Advanced Guides
  • Architecture
  • Examples
  • Ray Serve API