您現在的位置是:首頁 > 動作武俠首頁動作武俠
支援Python 3.10,OpenAI強化學習工具包Gym迎來史上最大更新
- 2022-10-01
網路上gym是什麼鬼
機器之心報道
編輯:杜偉
你在用了嗎?
OpenAI 建立的 Gym 是開源的 Python 庫,透過提供一個用於在學習演算法和環境之間通訊的標準 API 以及一組符合該 API 的標準環境,來開發和比較強化學習(DL)演算法。自推出以來,Gym 的 API 已經成為了領域標準。
目前,在 Gym 的專案主頁,Star 量已經達到了 26。6k。
專案地址:https://github。com/openai/gym
近日,Gym 迎來了迄今為止最大的更新,包括 API 變化、環境變化和其他變化。
API 變化
首先是 API 變化,包括如下:
env。reset 接受 3 個新的引數(options - 對於無再次初始化環境時控制課程學習等操作有用;seed - 未來環境 seed 可以傳遞到 reset 引數。老的 。seed() 方法被棄用,但考慮到向後相容,該方法在 Gym 1。0 釋出之前仍繼續如常工作;infos - 當設定為 True,reset 將返回 obs, info。當前這種做法預設為 False,但將變成 Gym 1。0 版本的預設行為);
環境名稱在註冊期間不再需要一個版本,並將智慧推薦類似名稱;
Vector 環境支援 info 中的 terminal_observation 並支援批處理操作空間。
環境變化
blackjack 和 frozen lake 示例環境現在使用 PyGame 進行了更好的圖形渲染;
機器人環境已移動到 gym-robotics 包中;
bipedal walker 和 lunar lander 環境現在被合併稱為一類;
Atari 環境現在使用標準種子 API 了;
修復了 car_racing box2d 環境中的大錯誤修復,碰撞版本;
重構了所有 box2d 和 classic_control 環境,以使用 PyGame 而不是 Pyglet。因為 pyglet 的問題一直是 gym 專案生命週期中最常見的 GitHub 問題來源之一。
其他變化
移除 DiscreteEnv 類,內建環境將不再使用;
增加了大數型別提示;
支援 Python 3。10 版;
大量額外的程式碼重構、清理、錯誤訊息改進和小