您現在的位置是:首頁 > 動作武俠首頁動作武俠

支援Python 3.10,OpenAI強化學習工具包Gym迎來史上最大更新

簡介OpenAI 建立的 Gym 是開源的 Python 庫,透過提供一個用於在學習演算法和環境之間通訊的標準 API 以及一組符合該 API 的標準環境,來開發和比較強化學習(DL)演算法

網路上gym是什麼鬼

支援Python 3.10,OpenAI強化學習工具包Gym迎來史上最大更新

機器之心報道

編輯:杜偉

你在用了嗎?

OpenAI 建立的 Gym 是開源的 Python 庫,透過提供一個用於在學習演算法和環境之間通訊的標準 API 以及一組符合該 API 的標準環境,來開發和比較強化學習(DL)演算法。自推出以來,Gym 的 API 已經成為了領域標準。

目前,在 Gym 的專案主頁,Star 量已經達到了 26。6k。

支援Python 3.10,OpenAI強化學習工具包Gym迎來史上最大更新

專案地址:https://github。com/openai/gym

近日,Gym 迎來了迄今為止最大的更新,包括 API 變化、環境變化和其他變化。

API 變化

首先是 API 變化,包括如下:

env。reset 接受 3 個新的引數(options - 對於無再次初始化環境時控制課程學習等操作有用;seed - 未來環境 seed 可以傳遞到 reset 引數。老的 。seed() 方法被棄用,但考慮到向後相容,該方法在 Gym 1。0 釋出之前仍繼續如常工作;infos - 當設定為 True,reset 將返回 obs, info。當前這種做法預設為 False,但將變成 Gym 1。0 版本的預設行為);

環境名稱在註冊期間不再需要一個版本,並將智慧推薦類似名稱;

Vector 環境支援 info 中的 terminal_observation 並支援批處理操作空間。

環境變化

blackjack 和 frozen lake 示例環境現在使用 PyGame 進行了更好的圖形渲染;

機器人環境已移動到 gym-robotics 包中;

bipedal walker 和 lunar lander 環境現在被合併稱為一類;

Atari 環境現在使用標準種子 API 了;

修復了 car_racing box2d 環境中的大錯誤修復,碰撞版本;

重構了所有 box2d 和 classic_control 環境,以使用 PyGame 而不是 Pyglet。因為 pyglet 的問題一直是 gym 專案生命週期中最常見的 GitHub 問題來源之一。

其他變化

移除 DiscreteEnv 類,內建環境將不再使用;

增加了大數型別提示;

支援 Python 3。10 版;

大量額外的程式碼重構、清理、錯誤訊息改進和小

Top