Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Meta ha presentado su primer modelo de lenguaje multimodal Llama 3.2, compuesto por los modelos de pequeño y mediano tamaño 11B y 90B, capaces de procesar tanto imágenes como texto, y por los modelos livianos de solo texto 1B y 3B. 

En el marco de su evento Meta Connect 2024, la tecnológica ha dado a conocer sus últimas novedades, incluido su nuevo modelo de lenguaje, que llega dos meses después de la presentación de Llama 3.1, y que introduce la capacidad de procesar imágenes por primera vez en la compañía. 

Así, el nuevo modelo Llama 3.2 se compone de dos modelos multimodales pequeño y mediano, con 11.000 millones de parámetros (11B) y 90.000 millones de parámetros (90B) respectivamente. En este sentido, los casos de uso de estos nuevos modelos admiten razonamiento de imágenes, como puede ser la comprensión de gráficos y diagramas o subtítulos de imágenes. Asimismo, también procesan la localización direccional de objetos en imágenes.

 Es decir, este modelo permite llevar a cabo acciones como extraer detalles de una fotografía, comprender la escena y, tras ello, crear oraciones que podrían utilizarse como título de la imagen o inicio para contar una historia. 

Igualmente, Llama 3.2 se completa con dos modelos de menor tamaño, 1B y 3B, que procesan texto exclusivamente y están ideados para funcionar en dispositivos, como un smartphone. Estos modelos están optimizados para procesadores ARM y pueden resolver múltiples tareas con una latencia mínima, asimismo, admiten una longitud de contexto de 128.000 tokens. 

En concreto, estos modelos permiten a los desarrolladores crear aplicaciones personalizadas en el dispositivo, asegurando los datos se mantienen privados dentro del 'smartphone' o producto en cuestión. Por ejemplo, Meta ha señalado que pueden utilizarse para llevar a cabo resúmenes de los diez últimos mensajes recibidos en una 'app' de mensajería instantánea. Igualmente, pueden aplicarse para enviar de forma automática invitaciones de calendario para organizar reuniones. 

Sin embargo, la tecnológica ha señalado que estos modelos destacan, sobre todo, por su capacidad de ejecutarse localmente. Por un lado, esta función permite que las indicaciones o respuestas del modelos sean instantáneas, ya que se procesan localmente. Por otra parte, garantiza una privacidad total, al no enviar datos como mensajes o información del calendario a la nube. 

COMPETITIVOS CON CLAUDE 3 HAIKU GPT4O-MINI 

Según la evaluación de estos modelos ofrecida por Meta, los modelos 3.2 11B y 90B son competitivos con los modelos básicos líderes, Claude 3 Haiku y GPT4o-mini en el reconocimiento de imágenes y una variedad de tareas de comprensión visual. 

Por su parte, el modelo 3B supera a los modelos Gemma 2 2.6B y Phi 3.5-mini a la hora de ejecutar tareas como seguir instrucciones, resumir, reescribir indicaciones y usar herramientas. Igualmente, el modelo 1B es en este ámbito con Gemma. 

Para llegar a estas conclusiones, Meta evaluó el rendimiento de los modelos en más de 150 conjuntos de datos de referencia que, abarcando una amplia variedad de idiomas. 

Con todo ello, la compañía ha señalado que el modelo de lenguaje grande Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, de cara a que empiecen a probar y experimentar sus posibilidades. Asimismo, todas estas capacidades se han incluido en su asistente de IA, Meta AI.

Tu opinión enriquece este artículo:

¿Te perdiste de leer esto? Las 10 notas más leídas que todo ejecutivo, inversionista y trendsetter se devoró en 2025

(Por J. Romanazzi y M. Maurizio) En 2025, en el corazón del ecosistema de negocios más dinámico de las Américas, estas diez notas de InfoNegocios Miami no solo generaron miles de lecturas; se convirtieron en artefactos culturales, en puntos de referencia en las conversaciones de alto nivel, desde los boardrooms de Brickell hasta las terrazas de Wynwood, desde Madrid, hasta Buenos Aires.  Estas notas cambiaron la visión porque tienen algo más que solo “la noticia”.

(Artículo de alto contenido estratégico: Lectura 3 minutos)

El gran despertar 2025-26: la obsolescencia programada del líder fóbico y el amanecer del coraje corporativo-institucional (P-1)

(Por Maqueda & Maurizio, con la colaboración de Rotmistrosvky-Otero) El paradigma del líder fóbico no solo está roto; está muerto Existe una falsa verdad tóxica, un elefante en la sala boardroom que hemos normalizado por décadas: la creencia de que el miedo (y el líder que ejecuta el poder desde el miedo, muchas veces disimulada como racionalidad) es un combustible eficiente para la productividad y la rentabilidad, pero afortunadamente este paradigma ha muerto.

(Tiempo de lectura: 4 minutos para ser más inteligente)

El Head de Cultura, el rol absolutamente clave hoy en las empresas tops de USA (que aún en Latinoamérica no se ha implementado)

(Por Juan Maqueda, Marcelo Maurizio y Estely Rotmistrovsky, desde Miami) En la actualidad, el Head de Cultura (también conocido como Chief Culture Officer o Director de Cultura o el Co-Ceo) es un puesto cada vez más relevante en las empresas, tanto en línea como fuera de línea. En esta nota te contamos sobre casos concretos de éxito de este rol en USA, Europa y América Latina.

(Tiempo de lectura estratégica y de alto valor: 4 minutos)

Cape San Blas: el “lujo sin cartel” del Panhandle que está redibujando el mapa turístico de Florida (y que Miami aún no explota)

(Por Vera - Maqueda) Mientras el algoritmo global insiste en los mismos nombres —Miami Beach, Key West, Orlando, incluso el corredor 30A—, en el noroeste de Florida sucede algo más sofisticado: Cape San Blas (Gulf County, cerca de Port St. Joe) se consolida como uno de los destinos más codiciados por quienes buscan belleza radical, privacidad real y naturaleza con estándares casi científicos. 

(Tiempo de lectura: 4 minutos para enamorarse)

Inter Miami y su plan maestro: cómo Giovani Lo Celso se convierte en la pieza clave del triángulo argentino para conquistar anglolatina

(Por Cánepa-Otero-Maquea-Maurizio) La inminente llegada de Giovani Lo Celso no es una simple contratación: es la consolidación de un ecosistema futbolístico argentino en suelo norteamericano, el golpe maestro que convierte a Miami en la extensión oficial de la Scaloneta y la jugada que redefinirá el balance de poder en la MLS para la próxima década.

(Tiempo de lectura: 4 minutos para ilusionarse)

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.