Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
half_cheetah_sac.png		half_cheetah_sac.png
hopper_sac.png		hopper_sac.png
humanoid_sac.png		humanoid_sac.png
inverted_pendulum_sac.png		inverted_pendulum_sac.png
walker2d_sac.png		walker2d_sac.png

README.md

Soft Actor Critic

Each experiment uses 3 seeds and is trained for 3M environment steps. The parameters used for SAC are the same parameters as described in the original paper.

Inverted Pendulum SAC - single worker

coach -p Mujoco_SAC -lvl inverted_pendulum

Hopper Clipped SAC - single worker

coach -p Mujoco_SAC -lvl hopper

Half Cheetah Clipped SAC - single worker

coach -p Mujoco_SAC -lvl half_cheetah

Walker 2D Clipped SAC - single worker

coach -p Mujoco_SAC -lvl walker2d

Humanoid Clipped SAC - single worker

coach -p Mujoco_SAC -lvl humanoid

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sac

sac

README.md

Soft Actor Critic

Inverted Pendulum SAC - single worker

Hopper Clipped SAC - single worker

Half Cheetah Clipped SAC - single worker

Walker 2D Clipped SAC - single worker

Humanoid Clipped SAC - single worker

Files

sac

Directory actions

More options

Directory actions

More options

Latest commit

History

sac

Folders and files

parent directory

README.md

Soft Actor Critic

Inverted Pendulum SAC - single worker

Hopper Clipped SAC - single worker

Half Cheetah Clipped SAC - single worker

Walker 2D Clipped SAC - single worker

Humanoid Clipped SAC - single worker