QuAKE: Speeding up Model Inference Using Quick and Approximate Kernels for Exponential Non-Linearities | Wadhwani School of Data Science and Artificial Intelligence

https://doi.org/10.48550/arXiv.2412.00408

Authors

Narayanaswami, Sai Kiran , Srinivasan, Gopalakrishnan , Ravindran, Balaraman

Preprint Server

arXiv

Sai Kiran Narayanaswami, Gopalakrishnan Srinivasan, Balaraman Ravindran. “QuAKE: Speeding up Model Inference Using Quick and Approximate Kernels for Exponential Non-Linearities”

Preprint link: https://arxiv.org/abs/2412.00408