Hacker News

new | ask | show | jobs

mdp2021 a year ago [ - ]

> I've had _every_ model fail this

That seems to be because LLMs don't seem to be able to follow procedures (e.g. reliably counting).