Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning #36220

ashok-arora · 2025-02-16T18:53:59Z

Model description

Gated Transformer-XL (GTrXL) improves upon Transformer-XL by addressing its instability in reinforcement learning. It introduces gating mechanisms similar to LSTMs, which help stabilize training and improve long-term memory retention. This makes GTrXL more effective in partially observable environments where capturing long-range dependencies is crucial.

Open source status

The model implementation is available
The model weights are available

Provide useful links for the implementation

ashok-arora added the New model label Feb 16, 2025

ashok-arora changed the title ~~GTrXL: Stabilizing Transformers for Reinforcement Learning~~ Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning Feb 17, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning #36220

Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning #36220

ashok-arora commented Feb 16, 2025 •

edited

Loading

Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning #36220

Request to add GTrXL: Stabilizing Transformers for Reinforcement Learning #36220

Comments

ashok-arora commented Feb 16, 2025 • edited Loading

Model description

Open source status

Provide useful links for the implementation

ashok-arora commented Feb 16, 2025 •

edited

Loading