Meta lanza Llama 4, su nueva generación de modelos de IA
Meta ha presentado Llama 4, una nueva familia de modelos de inteligencia artificial que incorpora capacidades multimodales avanzadas y una arquitectura más eficiente al ecosistema de IA abierta.

La nueva generación de Llama incluye tres modelos principales: Scout, Maverick y Behemoth, cada uno diseñado para cubrir diferentes necesidades y casos de uso. Todos ellos han sido entrenados con grandes cantidades de texto, imágenes y videos sin etiquetar, lo que les otorga una amplia comprensión visual.
Today is the start of a new era of natively multimodal AI innovation.
— AI at Meta (@AIatMeta) April 5, 2025
Today, we’re introducing the first Llama 4 models: Llama 4 Scout and Llama 4 Maverick — our most advanced models yet and the best in their class for multimodality.
Llama 4 Scout
• 17B-active-parameter model… pic.twitter.com/Z8P3h0MA1P
Scout y Maverick ya están disponibles a través de Llama.com y socios como Hugging Face, mientras que Behemoth aún se encuentra en fase de entrenamiento. Estos modelos representan un avance significativo en la forma en que Meta aborda la IA generativa, introduciendo por primera vez una arquitectura de mezcla de expertos (MoE).
Nueva arquitectura: Mixture of Experts
La principal novedad técnica de Llama 4 es la implementación de una arquitectura de mezcla de expertos, que divide las tareas de procesamiento de datos en subtareas y las delega a modelos "expertos" más pequeños y especializados. Este enfoque mejora la eficiencia tanto para el entrenamiento como para responder consultas.
Llama 4 is our first collection of models built using a mixture of experts (MoE) architecture. This architecture is more compute efficient for model training and inference and delivers higher quality models compared to dense architectures. pic.twitter.com/5ayTwglgym
— AI at Meta (@AIatMeta) April 5, 2025
Maverick, por ejemplo, cuenta con 400 mil millones de parámetros totales, pero solo 17 mil millones de parámetros activos distribuidos entre 128 "expertos". Scout tiene 17 mil millones de parámetros activos, 16 expertos y 109 mil millones de parámetros totales. Esta arquitectura permite modelos más potentes con una mayor eficiencia computacional.
Capacidades específicas para diferentes usos
Cada modelo tiene sus propias fortalezas:
- Scout destaca en tareas como la summarización de documentos y el razonamiento sobre grandes bases de código. Su ventana de contexto de 10 millones de tokens le permite procesar documentos extremadamente largos e imágenes, pudiendo funcionar en una sola GPU Nvidia H100.
- Maverick está orientado a casos de uso de asistente general y chat, como la escritura creativa. Según las pruebas internas de Meta, supera a modelos como GPT-4o de OpenAI y Gemini 2.0 de Google en ciertos benchmarks de codificación, razonamiento, multilingüismo y procesamiento de imágenes, aunque no alcanza las capacidades de modelos más recientes como Gemini 2.5 Pro, Claude 3.7 Sonnet o GPT-4.5.
- Behemoth, aún no lanzado, será el modelo más potente con 288 mil millones de parámetros activos, 16 expertos y casi dos billones de parámetros totales. Las pruebas internas sugieren que superará a GPT-4.5, Claude 3.7 Sonnet y Gemini 2.0 Pro en varias evaluaciones que miden habilidades STEM como la resolución de problemas matemáticos.
Limitaciones y controversias
La licencia de Llama 4 presenta algunas restricciones significativas. Los usuarios y empresas "domiciliados" o con un "lugar principal de negocios" en la UE tienen prohibido usar o distribuir los modelos, probablemente como resultado de los requisitos de gobernanza impuestos por las leyes de IA y privacidad de datos de la región.
Además, al igual que con versiones anteriores de Llama, las empresas con más de 700 millones de usuarios activos mensuales deben solicitar una licencia especial a Meta, que la compañía puede otorgar o denegar a su entera discreción.
Más neutralidad en temas controvertidos
Meta ha ajustado todos sus modelos Llama 4 para que se nieguen a responder preguntas "controvertidas" con menos frecuencia. Según la compañía, Llama 4 responde a temas políticos y sociales "debatidos" que la generación anterior de modelos Llama no abordaría. Además, la empresa afirma que Llama 4 es "dramáticamente más equilibrado" en cuanto a qué indicaciones rechaza de plano.
"Puedes contar con [Llama 4] para proporcionar respuestas útiles y fácticas sin juicios", declaró un portavoz de Meta. "Continuamos haciendo que Llama sea más receptivo para que responda más preguntas, pueda responder a una variedad de puntos de vista diferentes y no favorezca algunas opiniones sobre otras".
Estos ajustes llegan en un momento en que algunos aliados de la Casa Blanca acusan a los chatbots de IA de ser demasiado políticamente "woke" o progresistas. Muchos confidentes cercanos del presidente Donald Trump, incluidos el multimillonario Elon Musk y el "zar" de criptomonedas e IA David Sacks, han alegado que los chatbots de IA populares censuran las opiniones conservadoras.
Sin embargo, el sesgo en la IA sigue siendo un problema técnico intratable. Incluso xAI, la propia empresa de IA de Musk, ha luchado por crear un chatbot que no respalde algunas opiniones políticas sobre otras.
Integración en los productos de Meta
Meta AI, el asistente con IA de la compañía, ha sido actualizado para usar Llama 4 en 40 países a través de aplicaciones como WhatsApp, Messenger e Instagram. Sin embargo, las funciones multimodales están limitadas por ahora a Estados Unidos en inglés.
"Estos modelos Llama 4 marcan el comienzo de una nueva era para el ecosistema Llama", escribió Meta en una publicación de blog. "Este es solo el comienzo para la colección Llama 4", sugiriendo que podríamos ver más desarrollos en esta familia de modelos en el futuro cercano.
Implicaciones para el mercado de IA
El lanzamiento de Llama 4 refleja la estrategia de Meta de mantener su posición en el competitivo campo de los modelos de IA de código abierto. En un contexto donde empresas como OpenAI, Google, Anthropic y DeepSeek avanzan rápidamente con sus propias soluciones, Meta apuesta por una combinación de innovación técnica y disponibilidad amplia, aunque con las mencionadas restricciones geográficas y de escala.
La adopción de la arquitectura MoE y las mejoras en el manejo de contenido controvertido indican una dirección clara: modelos más capaces y equilibrados que puedan funcionar con eficiencia computacional. El tiempo dirá si estos avances logran consolidar a Meta como un actor principal en el desarrollo de inteligencia artificial generativa, especialmente en un momento donde el equilibrio entre rendimiento, accesibilidad y responsabilidad resulta cada vez más crucial para usuarios, desarrolladores y reguladores por igual.