Hacker News

Y

Hacker News

new | ask | show | jobs

nlarew an hour ago [ - ]

The frontier labs are not "fine-tuning", they're doing massive scale RL post-training