BPE tokenizer for LLM | ScratchStats