[資訊] 強化學習: Horizon

Horizon
https://github.com/facebookresearch/Horizon

360影片順暢的關鍵不藏私,臉書強化學習平臺Horizon開源了
https://www.ithome.com.tw/news/126825

Facebook開源首個適應大規模產品的強化學習平臺Horizon,基於PyTorch 1.0
https://mp.weixin.qq.com/s/cDfuasM7CzQxIefjFNNt6Q

Facebook 開源了一個強化學習端到端平臺 Horizon,該平臺利用強化學習(RL)來優化數十億使用者規模的產品及服務。Facebook 開發此平臺的目的是彌補 RL 在研究領域日益增強的影響力與其在生產領域的狹窄應用之間的落差。過去一年,Facebook 已在內部廣泛部署了 Horizon,提高了該平臺將 RL 基於決策的方法應用于大規模應用的能力。儘管其他人也在做 RL 應用方面的研究,但 Horizon 是第一個用於生產的開源 RL 平臺。

Horizon 專注于將 RL 應用於大型系統。本次開源包含用於類比環境的工作流程及用於生產預處理、訓練及模型匯出的分散式平臺。Horizon 平臺已經提高了 Facebook 的性能,包括發送相關度更高的通知、優化流視頻位元速率及提升 Messenger 中 M suggestions 的效果。但 Horizon 的開放性設計和工具集使得它可以惠及該領域其他研究人員,尤其是對利用 RL 從大量資訊中學習策略的公司和研究團隊而言。Horizon 不僅是 Facebook 繼續投資 RL 的證明,也表明這個充滿希望的人工智慧研究領域現在可以用於實際應用。


#Horizon, Facebook, Reinforcement learning, RL, 強化學習

留言