Hacker News

new | ask | show | jobs

salter2 2 hours ago [ - ]

Perhaps something similar to speculative decoding.

Speculating Experts Accelerates Inference for Mixture-of-Experts: https://arxiv.org/abs/2603.19289