Merge pull request #39 from YuechengLiu/gym_compatibility

TomorrowIsAnOtherDay · web-flow · commit 61e93465be20 · 2021-04-01T09:54:41.000+08:00
Gym compatibility for 'Quadrotor' Environment
diff --git a/rlschool/quadrotor/env.py b/rlschool/quadrotor/env.py
@@ -16,6 +16,7 @@
 import numpy as np
 from math import floor, ceil
 from collections import namedtuple
+import gym
 
 from rlschool.quadrotor.quadrotorsim import QuadrotorSim
 
@@ -26,7 +27,7 @@
     NO_DISPLAY = True
 
 
-class Quadrotor(object):
+class Quadrotor(gym.Env):
     """
     Quadrotor environment.
 
@@ -41,6 +42,7 @@ class Quadrotor(object):
             map is a 100x100 flatten floor.
         simulator_conf (None|str): path to simulator config xml file.
     """
+
     def __init__(self,
                  dt=0.01,
                  nt=1000,
@@ -68,13 +70,11 @@ def __init__(self,
 
         cfg_dict = self.simulator.get_config(simulator_conf)
         self.valid_range = cfg_dict['range']
-        self.action_space = namedtuple(
-            'action_space', ['shape', 'high', 'low', 'sample'])
-        self.action_space.shape = [4]
-        self.action_space.high = [cfg_dict['action_space_high']] * 4
-        self.action_space.low = [cfg_dict['action_space_low']] * 4
-        self.action_space.sample = Quadrotor.random_action(
-            cfg_dict['action_space_low'], cfg_dict['action_space_high'], 4)
+        self.action_space = gym.spaces.Box(
+            low=np.array([cfg_dict['action_space_low']] * 4, dtype='float32'),
+            high=np.array(
+                [cfg_dict['action_space_high']] * 4, dtype='float32'),
+            shape=[4])
 
         self.body_velocity_keys = ['b_v_x', 'b_v_y', 'b_v_z']
         self.body_position_keys = ['b_x', 'b_y', 'b_z']
@@ -91,8 +91,7 @@ def __init__(self,
             len(self.flight_pose_keys) + len(self.barometer_keys)
         if self.task == 'velocity_control':
             obs_dim += len(self.task_velocity_control_keys)
-        self.observation_space = namedtuple('observation_space', ['shape'])
-        self.observation_space.shape = [obs_dim]
+        self.observation_space = gym.Space(shape=[obs_dim], dtype='float32')
 
         self.state = {}
         self.viewer = None
@@ -300,14 +299,6 @@ def load_map(map_file):
 
         return np.array(map_lists)
 
-    @staticmethod
-    def random_action(low, high, dim):
-        @staticmethod
-        def sample():
-            act = np.random.random_sample((dim,))
-            return (high - low) * act + low
-        return sample
-
 
 if __name__ == '__main__':
     import sys
diff --git a/setup.py b/setup.py
@@ -52,7 +52,8 @@
         'trimesh>=3.2.39',
         'networkx>=2.2',
         'colour>=0.1.5',
-        'scipy>=0.12.0'
+        'scipy>=0.12.0',
+        'gym==0.18.0',
     ],
     zip_safe=False,
 )