Hacker News

Y

Hacker News

new | ask | show | jobs

p1esk 3 days ago [ - ]

With good quantization you can get 36GB down to 8GB. To get 36B down to 8B you need good pruning.