Hacker News

Y

Hacker News

new | ask | show | jobs

grumpoholic 2 hours ago [ - ]

With speculative decoding you can use more models to speed up the generation however.