Modelli byte-level con diffusione e speculazione per generazione più rapida e riduzione dei costiFast Byte Latent Transformer: efficienza e innovazione
Il nuovo Fast Byte Latent Transformer (BLT) introduce BLT Diffusion e Self-speculation per generare byte in parallelo, riducendo fino al 92% la larghezza di banda. Valutato su traduzione e generazione di codice a scale 1B e 3B, mantiene prestazioni competitive con minori risorse computazionali.