Hacker News

new | ask | show | jobs

mirekrusin 14 hours ago [ - ]

2x RTX 4090, Q8, 256k context, 110 t/s

instagib 7 hours ago [ - ]

1 4090, Qwen3.5-35B-A3B-UD-MXFP4_MOE, 64k context, 122 t/s. Llama.cpp