Análisis
Transformer Architecture: Análisis Comparativo de Encoder y Decoder Stacks
Desglose técnico de la arquitectura Transformer (Vaswani et al., 2017) y su bifurcación en modelos Encoder-only (BERT) y Decoder-only (GPT). Análisis del mecanismo Scaled Dot-Product Attention, implementación de máscaras de causalidad y evaluación de complejidad computacional.