isaac-sim · Tldaxia · Apr 23, 2025 · Apr 24, 2025 · Apr 24, 2025 · Apr 25, 2025
diff --git a/.gitignore b/.gitignore
@@ -60,3 +60,5 @@ _build
 
 # Pre-Trained Checkpoints
 /.pretrained_checkpoints/
+
+*hdf5
diff --git a/scripts/imitation_learning/isaaclab_mimic/generate_dataset.py b/scripts/imitation_learning/isaaclab_mimic/generate_dataset.py
@@ -63,7 +63,7 @@ def main():
     output_dir, output_file_name = setup_output_paths(args_cli.output_file)
     env_name = args_cli.task or get_env_name_from_dataset(args_cli.input_file)
 
-    # Configure environment
+    # Configure environment  
     env_cfg, success_term = setup_env_config(
         env_name=env_name,
         output_dir=output_dir,
@@ -87,10 +87,10 @@ def main():
     # Setup and run async data generation
     async_components = setup_async_generation(
         env=env,
-        num_envs=args_cli.num_envs,
-        input_file=args_cli.input_file,
-        success_term=success_term,
-        pause_subtask=args_cli.pause_subtask,
+        num_envs=args_cli.num_envs, # 并发环境数量
+        input_file=args_cli.input_file,  # 输入数据集文件
+        success_term=success_term, # 成功终止条件
+        pause_subtask=args_cli.pause_subtask, # 是否在每个子任务后暂停
     )
 
     try:

@@ -0,0 +1,314 @@
+# Copyright (c) 2024-2025, The Isaac Lab Project Developers.
+# All rights reserved.
+#
+# SPDX-License-Identifier: BSD-3-Clause
+
+"""
+Script to record demonstrations with Isaac Lab environments using human teleoperation.
+
+This script allows users to record demonstrations operated by human teleoperation for a specified task.
+The recorded demonstrations are stored as episodes in a hdf5 file. Users can specify the task, teleoperation
+device, dataset directory, and environment stepping rate through command-line arguments.
+
+required arguments:
+    --task                    Name of the task.
+
+optional arguments:
+    -h, --help                Show this help message and exit
+    --teleop_device           Device for interacting with environment. (default: keyboard)
+    --dataset_file            File path to export recorded demos. (default: "./datasets/dataset.hdf5")
+    --step_hz                 Environment stepping rate in Hz. (default: 30)
+    --num_demos               Number of demonstrations to record. (default: 0)
+    --num_success_steps       Number of continuous steps with task success for concluding a demo as successful. (default: 10)
+"""
+
+"""Launch Isaac Sim Simulator first."""
+
+import argparse
+import os
+
+from isaaclab.app import AppLauncher
+
+# add argparse arguments
+parser = argparse.ArgumentParser(description="Record demonstrations for Isaac Lab environments.")
+parser.add_argument("--task", type=str, default=None, help="Name of the task.")
+parser.add_argument("--teleop_device", type=str, default="keyboard", help="Device for interacting with environment.")
+parser.add_argument(
+    "--dataset_file", type=str, default="./datasets/dataset.hdf5", help="File path to export recorded demos."
+)
+parser.add_argument("--step_hz", type=int, default=30, help="Environment stepping rate in Hz.")
+parser.add_argument(
+    "--num_demos", type=int, default=0, help="Number of demonstrations to record. Set to 0 for infinite."
+)
+parser.add_argument(
+    "--num_success_steps",
+    type=int,
+    default=10,
+    help="Number of continuous steps with task success for concluding a demo as successful. Default is 10.",
+)
+# append AppLauncher cli args
+AppLauncher.add_app_launcher_args(parser)
+# parse the arguments
+args_cli = parser.parse_args()
+
+if args_cli.teleop_device.lower() == "handtracking":
+    vars(args_cli)["experience"] = f'{os.environ["ISAACLAB_PATH"]}/apps/isaaclab.python.xr.openxr.kit'
+
+# launch the simulator
+app_launcher = AppLauncher(args_cli)
+simulation_app = app_launcher.app
+
+"""Rest everything follows."""
+
+import contextlib
+import gymnasium as gym
+import time
+import torch
+
+import omni.log
+
+from isaaclab.devices import Se3HandTracking, Se3Keyboard, Se3SpaceMouse
+from isaaclab.envs import ViewerCfg,ManagerBasedRLEnv
+from isaaclab.envs.mdp.recorders.recorders_cfg import ActionStateRecorderManagerCfg
+from isaaclab.envs.ui import ViewportCameraController
+from isaaclab.markers import VisualizationMarkers
+from isaaclab.markers.config import FRAME_MARKER_CFG
+
+import isaaclab_tasks  # noqa: F401
+from isaaclab_tasks.utils.parse_cfg import parse_env_cfg
+
+
+class RateLimiter:
+    """Convenience class for enforcing rates in loops."""
+
+    def __init__(self, hz):
+        """
+        Args:
+            hz (int): frequency to enforce
+        """
+        self.hz = hz
+        self.last_time = time.time()
+        self.sleep_duration = 1.0 / hz
+        self.render_period = min(0.033, self.sleep_duration)
+
+    def sleep(self, env):
+        """Attempt to sleep at the specified rate in hz."""
+        next_wakeup_time = self.last_time + self.sleep_duration
+        while time.time() < next_wakeup_time:
+            time.sleep(self.render_period)
+            env.sim.render()
+
+        self.last_time = self.last_time + self.sleep_duration
+
+        # detect time jumping forwards (e.g. loop is too slow)
+        if self.last_time < time.time():
+            while self.last_time < time.time():
+                self.last_time += self.sleep_duration
+
+
+def pre_process_actions(arm_action: torch.Tensor, open_gripper: bool) -> torch.Tensor:
+    """Pre-process actions for the environment.
+    gripper_command:  True  开   False  关
+    """
+    # compute actions based on environment
+    if "Reach" in args_cli.task:
+        # note: reach is the only one that uses a different action space
+        # compute actions
+        return arm_action
+    else:
+        # resolve gripper command
+        gripper_vel = torch.zeros((arm_action.shape[0], 1), dtype=torch.float, device=arm_action.device)
+        gripper_vel[:] = 1 if open_gripper else -1
+        # compute actions
+        return torch.concat([arm_action, gripper_vel], dim=1)
+
+def get_waypoints(env:ManagerBasedRLEnv):
+    """从场景中找到其中设定的路径点位置"""
+    waypoint_states = env.obs_buf["policy"]["waypoint_states"]
+    raw_waypoint_poses = waypoint_states[:, :7]
+    hand_waypoint_poses = waypoint_states[:, 7:-1]
+    waypoint_gripper_actions = waypoint_states[:, -1:]
+    return raw_waypoint_poses,hand_waypoint_poses, waypoint_gripper_actions 
+
+def gen_actions(env:ManagerBasedRLEnv):
+    """将路点转换为末端执行器(ee)对应要求的任务空间的动作"""
+
+    # 以观测的形式获取场景中定义的路点的位置以及夹爪动作命令
+    raw_waypoint_poses,hand_waypoint_poses, gripper_actions = get_waypoints(env)
+    # 随便写的一些动作，仅仅是为了占位，满足任务空间动作的形式要求 
+    kp_set_task = torch.tensor([420.0, 420.0, 420.0, 420.0, 420.0, 420.0],
+                               device=env.device).repeat(raw_waypoint_poses.shape[0], 1)
+
+    actions = torch.cat([hand_waypoint_poses, kp_set_task], dim=-1)
+    # gripper 动作命令，  0： 关闭   1： 打开  -1： 不动
+    gripper_commands = gripper_actions[:, 0]
+    return raw_waypoint_poses, actions, gripper_commands
+
+def execute_action(env:ManagerBasedRLEnv, arm_action: torch.Tensor, 
+                      gripper_command: torch.Tensor, success_term=None, 
+                      rate_limiter=None,marker:VisualizationMarkers=None,last_gripper_command:bool=None):
+    """执行单次路点动作，包含ee动作和夹爪动作"""
+    # 
+    should_reset_recording_instance = False
+    success_step_count = 0
+    # convert to torch
+    arm_action = torch.tensor(arm_action.clone().detach(),
+                              dtype=torch.float, device=env.device).repeat(env.num_envs, 1)
+    if gripper_command == -1:
+        # 如果不动，则维持上一个夹爪动作
+        bool_gripper_command = last_gripper_command
+    elif gripper_command == 1: # 要求打开
+        bool_gripper_command = True
+    else: # 要求关闭
+        bool_gripper_command = False
+
+    # 夹爪动作置为false, 在执行arm动作时不执行夹爪动作
+    ee_action = pre_process_actions(arm_action, open_gripper=last_gripper_command)
+    # 夹爪动作
+    gripper_action = pre_process_actions(arm_action, open_gripper=bool_gripper_command)
+    # 先执行ee动作,夹爪保持不变
+    # 这里设置了固定的时间步长
+    for _ in range(50):
+        # perform action on environment
+        env.step(ee_action)
+        # 计算当前末端执行器的位姿，不过这里没用到
+        current_ee_pos = env.scene
+        # 获取观测，显示当前ee手指中心的位置
+        marker.visualize(env.obs_buf["policy"]["ee_pos"], env.obs_buf["policy"]["ee_quat"])
+
+        # 判断回合是否成功
+        if success_term is not None:
+            if bool(success_term.func(env, **success_term.params)[0]):
+                success_step_count += 1
+                # 检查当前连续成功的步数（success_step_count）是否达到预设阈值
+                if success_step_count >= args_cli.num_success_steps: 
+                    env.recorder_manager.record_pre_reset([0], force_export_or_skip=False)
+                    env.recorder_manager.set_success_to_episodes(
+                        [0], torch.tensor([[True]], dtype=torch.bool, device=env.device)
+                    )
+                    env.recorder_manager.export_episodes([0])
+                    should_reset_recording_instance = True
+            else:
+                success_step_count = 0
+
+
+        # TODO: 这里需要检查当前末端执行器的位姿是否到达了目标位置,我这里简写了一下是固定的循环次数
+        if env.sim.is_stopped()  or should_reset_recording_instance:
+            break
+        # 
+        if rate_limiter:
+            rate_limiter.sleep(env)
+
+
+    # 再执行gripper动作
+    current_gripper_state = env.obs_buf["policy"]["gripper_state"]
+    if bool_gripper_command != current_gripper_state and not should_reset_recording_instance:
+        for _ in range(30):
+            # perform gripper action on environment
+            env.step(gripper_action)
+
+            # 判断是否成功
+            if success_term is not None:
+                if bool(success_term.func(env, **success_term.params)[0]):
+                    success_step_count += 1
+                    if success_step_count >= args_cli.num_success_steps:
+                        env.recorder_manager.record_pre_reset([0], force_export_or_skip=False)
+                        env.recorder_manager.set_success_to_episodes(
+                            [0], torch.tensor([[True]], dtype=torch.bool, device=env.device)
+                        )
+                        env.recorder_manager.export_episodes([0])
+                        should_reset_recording_instance = True
+                else:
+                    success_step_count = 0
+            # 检查是否打断
+            if env.sim.is_stopped() or should_reset_recording_instance:
+                break
+
+            if rate_limiter:
+                rate_limiter.sleep(env)
+
+    # 更新上一个指令
+    last_gripper_command = bool_gripper_command
+
+    return should_reset_recording_instance,last_gripper_command
+
+def main():
+    """通过回放预设路点的形式来收集任务的演示数据集."""
+    rate_limiter = RateLimiter(args_cli.step_hz)
+    # 获取并创建数据集的存放路径
+    output_dir = os.path.dirname(args_cli.dataset_file)
+    output_file_name = os.path.splitext(os.path.basename(args_cli.dataset_file))[0]
+    if not os.path.exists(output_dir):
+        os.makedirs(output_dir)
+
+    # 获取当前任务环境的名称
+    env_cfg = parse_env_cfg(args_cli.task, device=args_cli.device, num_envs=1)
+    env_cfg.env_name = args_cli.task
+    # 从配置文件中获取成功检测函数，这一点就是我们设置的成功检测函数
+    success_term = None
+    if hasattr(env_cfg.terminations, "success"):
+        success_term = env_cfg.terminations.success
+        env_cfg.terminations.success = None
+    else:
+        omni.log.warn(
+            "No success termination term was found in the environment."
+            " Will not be able to mark recorded demos as successful."
+        )
+    # 这里禁止了超时判断，使得环境只能在达到你设定的成功条件后再结束一个回合
+    env_cfg.terminations.time_out = None
+    # 这里不允许isaacsim自动把观测信息拼接在一起，而是单独保存
+    env_cfg.observations.policy.concatenate_terms = False
+    # 应该是设置录像器？
+    env_cfg.recorders: ActionStateRecorderManagerCfg = ActionStateRecorderManagerCfg()
+    env_cfg.recorders.dataset_export_dir_path = output_dir
+    env_cfg.recorders.dataset_filename = output_file_name
+    # 创建环境对象
+    env = gym.make(args_cli.task, cfg=env_cfg).unwrapped
+    # 判断是否应该重置录像器的flag  
+    should_reset_recording_instance = False
+    # 开始之前先重置环境
+    env.reset()
+    # 在isaacsim仿真器中设置坐标系的marker，用来显示坐标系，调试用
+    frame_marker_cfg = FRAME_MARKER_CFG.copy()
+    frame_marker_cfg.markers["frame"].scale = (0.1, 0.1, 0.1)
+    # 定义了两个marker，一个是末端执行器的坐标系，一个是目标位置的坐标系
+    ee_marker = VisualizationMarkers(frame_marker_cfg.replace(prim_path="/Visuals/ee_current"))
+    goal_marker = VisualizationMarkers(frame_marker_cfg.replace(prim_path="/Visuals/ee_goal"))
+    # 当前已经记录下来的成功demo回合数量
+    current_recorded_demo_count = 0
+    # 一直自动生成，直到到达指定的成功demo数量
+    while current_recorded_demo_count < args_cli.num_demos:
+        # 从场景中获取当前回合中的路点以及对应的夹爪动作
+        raw_waypoint_poses, actions, gripper_commands = gen_actions(env)
+        # 默认初始的gripper动作是 open，即使你没有手动给定，例如 waypoint_0 等价于 waypoint_0_open
+        last_gripper_command = True
+        # 逐一执行刚收集的所有路点
+        for waypoint_idx in range(actions.shape[0]):
+            # 显示当前路点的坐标系
+            goal_marker.visualize(raw_waypoint_poses[waypoint_idx][None,0:3], raw_waypoint_poses[waypoint_idx][None,3:7])
+            # 执行该路点对应的动作，并判断是否重置回合，回传保存当前的夹爪动作
+            should_reset_recording_instance,last_gripper_command = execute_action(env, actions[waypoint_idx], 
+                                                            gripper_commands[waypoint_idx], 
+                                                            success_term=success_term, 
+                                                            rate_limiter=rate_limiter,
+                                                            marker=ee_marker,
+                                                            last_gripper_command=last_gripper_command)
+            # 如果满足了成功条件，或者手动退出了当前回合，则退出当前回合
+            if should_reset_recording_instance:
+                break
+        # 如果当前回合成功结束，就打印出当前回合的成功次数，并更新current_recorded_demo_count
+        if env.recorder_manager.exported_successful_episode_count > current_recorded_demo_count:
+            current_recorded_demo_count = env.recorder_manager.exported_successful_episode_count
+            print(f"Recorded {current_recorded_demo_count} successful demonstrations.")
+        # 不论回合怎么结束，在这里都要重置录像器和环境自身
+        env.recorder_manager.reset()
+        env.reset()
+    # 成功完成要求的n次回合之后，就关闭环境
+    print(f"All {args_cli.num_demos} demonstrations recorded. Exiting the app.")
+    env.close() 
+
+if __name__ == "__main__":
+    # run the main function
+    main()
+    # close sim app
+    simulation_app.close()
@@ -125,16 +125,17 @@ def run_simulator(sim: sim_utils.SimulationContext, scene: InteractiveScene):
 
     # Create the OSC
     osc_cfg = OperationalSpaceControllerCfg(
-        target_types=["pose_abs", "wrench_abs"],
-        impedance_mode="variable_kp",
-        inertial_dynamics_decoupling=True,
+        target_types=["pose_abs",  # 相对于机器人基坐标系的绝对位姿
+                      "wrench_abs"], # 控制末端施加的力/力矩（也相对于 base）
+        impedance_mode="variable_kp", # 可变刚度模式（variable stiffness）
+        inertial_dynamics_decoupling=True, # 启用 惯性解耦
         partial_inertial_dynamics_decoupling=False,
-        gravity_compensation=False,
-        motion_damping_ratio_task=1.0,
-        contact_wrench_stiffness_task=[0.0, 0.0, 0.1, 0.0, 0.0, 0.0],
-        motion_control_axes_task=[1, 1, 0, 1, 1, 1],
-        contact_wrench_control_axes_task=[0, 0, 1, 0, 0, 0],
-        nullspace_control="position",
+        gravity_compensation=False, # 不补偿重力
+        motion_damping_ratio_task=1.0, # 运动阻尼比，设置为1.0 表示临界阻尼，在执行任务时，机器人不会震荡或过冲
+        contact_wrench_stiffness_task=[0.0, 0.0, 0.1, 0.0, 0.0, 0.0], # 力控制方向上的“刚度” 6D 向量（x, y, z, roll, pitch, yaw），仅对 z方向的力 设置了非零刚度 0.1（其他方向是软的）
+        motion_control_axes_task=[1, 1, 0, 1, 1, 1],  # 允许末端哪些自由度运动（x, y, z, roll, pitch, yaw），只让末端 在 xy 平面内自由移动并控制朝向，不允许末端 z 方向乱动（比如浮起来）
+        contact_wrench_control_axes_task=[0, 0, 1, 0, 0, 0], # 控制末端哪些自由度的力，这里只控制 z 方向的末端力（比如下压）
+        nullspace_control="position",# 控制多余自由度的方式（Nullspace control），这里使用位置控制去处理 nullspace，比如让手臂靠中、躲避障碍等
     )
     osc = OperationalSpaceController(osc_cfg, num_envs=scene.num_envs, device=sim.device)
 

diff --git a/source/isaaclab/isaaclab/envs/mimic_env_cfg.py b/source/isaaclab/isaaclab/envs/mimic_env_cfg.py
@@ -78,16 +78,21 @@ class SubTaskConfig:
     """
     Configuration settings specific to the management of individual
     subtasks.
+    IsaacLab认为，一整条轨迹，可以被分解为多个子任务，例如“伸手去抓”，“拿起来”等，类似于
+    从当前的位置执行到下个一离散路点的动作。每个子任务都有一个起始点和终止点，起始点是当前的状态，终止点是下一个。
+
+    而这个类，就是对每个子任务片段的配置设置；
+
     """
 
     ##############################################################
     # Mandatory options that should be defined for every subtask
 
     # Reference to the object involved in this subtask, None if no
-    # object is involved (this is rarely the case).
+    # object is involved (this is rarely the case).这个子任务涉及的参考物体（用于姿态对齐）
     object_ref: str = None
 
-    # Signal for subtask termination
+    # Signal for subtask termination 哪个 termination signal 表示子任务完成
     subtask_term_signal: str = None
 
     ##############################################################
Original file line number	Diff line number	Diff line change
Expand Up		@@ -60,3 +60,5 @@ _build

		# Pre-Trained Checkpoints
		/.pretrained_checkpoints/

		*hdf5