Modelos de lenguaje a nivel de byte que combinan tokenización latente jerárquica y difusión discreta para generación paralelaBLT-D: Difusión de bytes con verificación autoregresiva
Byte Latent Transformer (BLT) se combina con difusión discreta por bloques para generar bytes (BLT-D), logrando hasta un 92% de reducción en coste de ancho de banda. Se proponen variantes con verificación autoregresiva (BLT-DV) y auto-especulación (BLT-S). Evaluado en traducción y generación de código con modelos de 1B y 3B parámetros.