Hacker News

Y

Hacker News

new | ask | show | jobs

noddybear 7 hours ago [ - ]

Aren’t Unicode characters generally treated as 2 tokens to avoid a huge vocabulary?