Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Meta ha presentado su primer modelo de lenguaje multimodal Llama 3.2, compuesto por los modelos de pequeño y mediano tamaño 11B y 90B, capaces de procesar tanto imágenes como texto, y por los modelos livianos de solo texto 1B y 3B. 

En el marco de su evento Meta Connect 2024, la tecnológica ha dado a conocer sus últimas novedades, incluido su nuevo modelo de lenguaje, que llega dos meses después de la presentación de Llama 3.1, y que introduce la capacidad de procesar imágenes por primera vez en la compañía. 

Así, el nuevo modelo Llama 3.2 se compone de dos modelos multimodales pequeño y mediano, con 11.000 millones de parámetros (11B) y 90.000 millones de parámetros (90B) respectivamente. En este sentido, los casos de uso de estos nuevos modelos admiten razonamiento de imágenes, como puede ser la comprensión de gráficos y diagramas o subtítulos de imágenes. Asimismo, también procesan la localización direccional de objetos en imágenes.

 Es decir, este modelo permite llevar a cabo acciones como extraer detalles de una fotografía, comprender la escena y, tras ello, crear oraciones que podrían utilizarse como título de la imagen o inicio para contar una historia. 

Igualmente, Llama 3.2 se completa con dos modelos de menor tamaño, 1B y 3B, que procesan texto exclusivamente y están ideados para funcionar en dispositivos, como un smartphone. Estos modelos están optimizados para procesadores ARM y pueden resolver múltiples tareas con una latencia mínima, asimismo, admiten una longitud de contexto de 128.000 tokens. 

En concreto, estos modelos permiten a los desarrolladores crear aplicaciones personalizadas en el dispositivo, asegurando los datos se mantienen privados dentro del 'smartphone' o producto en cuestión. Por ejemplo, Meta ha señalado que pueden utilizarse para llevar a cabo resúmenes de los diez últimos mensajes recibidos en una 'app' de mensajería instantánea. Igualmente, pueden aplicarse para enviar de forma automática invitaciones de calendario para organizar reuniones. 

Sin embargo, la tecnológica ha señalado que estos modelos destacan, sobre todo, por su capacidad de ejecutarse localmente. Por un lado, esta función permite que las indicaciones o respuestas del modelos sean instantáneas, ya que se procesan localmente. Por otra parte, garantiza una privacidad total, al no enviar datos como mensajes o información del calendario a la nube. 

COMPETITIVOS CON CLAUDE 3 HAIKU GPT4O-MINI 

Según la evaluación de estos modelos ofrecida por Meta, los modelos 3.2 11B y 90B son competitivos con los modelos básicos líderes, Claude 3 Haiku y GPT4o-mini en el reconocimiento de imágenes y una variedad de tareas de comprensión visual. 

Por su parte, el modelo 3B supera a los modelos Gemma 2 2.6B y Phi 3.5-mini a la hora de ejecutar tareas como seguir instrucciones, resumir, reescribir indicaciones y usar herramientas. Igualmente, el modelo 1B es en este ámbito con Gemma. 

Para llegar a estas conclusiones, Meta evaluó el rendimiento de los modelos en más de 150 conjuntos de datos de referencia que, abarcando una amplia variedad de idiomas. 

Con todo ello, la compañía ha señalado que el modelo de lenguaje grande Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, de cara a que empiecen a probar y experimentar sus posibilidades. Asimismo, todas estas capacidades se han incluido en su asistente de IA, Meta AI.

Tu opinión enriquece este artículo:

Amazon, la empresa de comercio electrónico más innovadora según los consumidores

El Índice Español de Innovación (ÍEI) de la Universidad Carlos III de Madrid (UC3M), ha reconocido a Amazon como la empresa más innovadora del comercio electrónico en España por cuarto año consecutivo, consolidando esta posición gracias a una subida mejora de 2,7 puntos con respecto al año pasado (del 74,5 en 2024 a 77,2 en 2025). El estudio analiza 131 empresas de 21 sectores y representa más del 70 % del consumo de los hogares españoles. 

Claude, ChatGPT, Cursor y otros agentes de IA ya pueden crear y gestionar contenido en sitios WordPress.com

WordPress.com, plataforma de hosting y líder en creación web propiedad de Automattic, anuncia la incorporación de capacidades de escritura a su servidor MCP (Model Context Protocol). A partir de ahora, los agentes de inteligencia artificial compatibles, como Claude, ChatGPT o Cursor, pueden crear, editar y gestionar contenidos directamente en sitios WordPress.com a través de conversación natural y siempre bajo la supervisión del usuario.

El 98% de las familias españolas supervisa las compras online de sus hijos e hijas adolescentes, según un estudio de Fad Juventud y Amazon

Fad Juventud y Amazon presentaron los resultados del estudio "Consumo online en familia", que examina el consumo online y los hábitos de compra en familias españolas con adolescentes de 12 a 17 años. Con una muestra de 1.032 padres y madres en España, la investigación revela que las familias españolas supervisan prácticamente la totalidad de las actividades de compra de sus hijos a través de distintos mecanismos, con el 98,1% monitorizando las compras online. 

7 de cada 10 españoles viajará esta Semana Santa y casi la mitad recurrirá a sus ahorros para pagar sus escapadas (que costarán de media 598 euros)

Las vacaciones de Semana Santa se consolidan como uno de los principales periodos de viaje para los españoles, pues aprovechan estos días para realizar escapadas y desconectar antes de la temporada estival. Tal es así que 7 de cada 10 españoles (70,1 %) tienen previsto viajar durante estas fiestas, frente a un 3,9 % que afirma que no podrá hacerlo por no disponer de vacaciones. 

El Corte Inglés y Mensajeros de la Paz impulsan “We Care” para mejorar la vida de personas en situación de vulnerabilidad

En España, el 25,7 % de la población se encuentra en riesgo de pobreza o exclusión social, lo que equivale a cerca de 12,5 millones de personas, según los últimos datos del INE. En este contexto, ILUNION TextilCare, ha puesto en marcha “We Care”, una iniciativa de voluntariado desarrollada junto a El Corte Inglés y Mensajeros de la Paz, que combina el acceso a servicios básicos de higiene y ropa con acciones de acompañamiento y orientación laboral para facilitar la inserción personas en situación de vulnerabilidad.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.