Adaptive Action Duration with Contextual Bandits for Deep Reinforcement Learning in Dynamic Environments | Wadhwani School of Data Science and Artificial Intelligence

https://doi.org/10.48550/arXiv.2507.00030

Authors

Verma, Abhishek , V, Nallarasan , Ravindran, Balaraman

Preprint Server

arXiv

Abhishek Verma, Nallarasan V, Balaraman Ravindran, Adaptive Action Duration with Contextual Bandits for Deep Reinforcement Learning in Dynamic Environments

Preprint link: https://arxiv.org/abs/2507.00030