Policy Optimization

Constrained Policy Optimization via Sampling-Based Weight-Space Projection

Safety-critical learning requires policies that improve performance without leaving the safe operating regime. We study constrained policy learning where model parameters must …

Shengfan Cao

• Dec 1, 2025 • 1 min read

No results found

Policy Optimization

Constrained Policy Optimization via Sampling-Based Weight-Space Projection