Option Encoder: A Framework for Discovering a Policy Basis in Reinforcement Learning | Wadhwani School of Data Science and Artificial Intelligence

DOI Link

https://doi.org/10.1007/978-3-030-67661-2_30

Authors

Arjun Manoharan , Rahul Ramesh , Balaraman Ravindran

Published In

Lecture Notes in Computer Science, p. 509-524

Tags

Hierarchical Reinforcement Learning Policy Distillation