Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Meta ha presentado su primer modelo de lenguaje multimodal Llama 3.2, compuesto por los modelos de pequeño y mediano tamaño 11B y 90B, capaces de procesar tanto imágenes como texto, y por los modelos livianos de solo texto 1B y 3B.

En el marco de su evento Meta Connect 2024, la tecnológica ha dado a conocer sus últimas novedades, incluido su nuevo modelo de lenguaje, que llega dos meses después de la presentación de Llama 3.1, y que introduce la capacidad de procesar imágenes por primera vez en la compañía.

Así, el nuevo modelo Llama 3.2 se compone de dos modelos multimodales pequeño y mediano, con 11.000 millones de parámetros (11B) y 90.000 millones de parámetros (90B) respectivamente. En este sentido, los casos de uso de estos nuevos modelos admiten razonamiento de imágenes, como puede ser la comprensión de gráficos y diagramas o subtítulos de imágenes. Asimismo, también procesan la localización direccional de objetos en imágenes.

Es decir, este modelo permite llevar a cabo acciones como extraer detalles de una fotografía, comprender la escena y, tras ello, crear oraciones que podrían utilizarse como título de la imagen o inicio para contar una historia.

Igualmente, Llama 3.2 se completa con dos modelos de menor tamaño, 1B y 3B, que procesan texto exclusivamente y están ideados para funcionar en dispositivos, como un smartphone. Estos modelos están optimizados para procesadores ARM y pueden resolver múltiples tareas con una latencia mínima, asimismo, admiten una longitud de contexto de 128.000 tokens.

En concreto, estos modelos permiten a los desarrolladores crear aplicaciones personalizadas en el dispositivo, asegurando los datos se mantienen privados dentro del 'smartphone' o producto en cuestión. Por ejemplo, Meta ha señalado que pueden utilizarse para llevar a cabo resúmenes de los diez últimos mensajes recibidos en una 'app' de mensajería instantánea. Igualmente, pueden aplicarse para enviar de forma automática invitaciones de calendario para organizar reuniones.

Sin embargo, la tecnológica ha señalado que estos modelos destacan, sobre todo, por su capacidad de ejecutarse localmente. Por un lado, esta función permite que las indicaciones o respuestas del modelos sean instantáneas, ya que se procesan localmente. Por otra parte, garantiza una privacidad total, al no enviar datos como mensajes o información del calendario a la nube.

COMPETITIVOS CON CLAUDE 3 HAIKU GPT4O-MINI

Según la evaluación de estos modelos ofrecida por Meta, los modelos 3.2 11B y 90B son competitivos con los modelos básicos líderes, Claude 3 Haiku y GPT4o-mini en el reconocimiento de imágenes y una variedad de tareas de comprensión visual.

Por su parte, el modelo 3B supera a los modelos Gemma 2 2.6B y Phi 3.5-mini a la hora de ejecutar tareas como seguir instrucciones, resumir, reescribir indicaciones y usar herramientas. Igualmente, el modelo 1B es en este ámbito con Gemma.

Para llegar a estas conclusiones, Meta evaluó el rendimiento de los modelos en más de 150 conjuntos de datos de referencia que, abarcando una amplia variedad de idiomas.

Con todo ello, la compañía ha señalado que el modelo de lenguaje grande Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, de cara a que empiecen a probar y experimentar sus posibilidades. Asimismo, todas estas capacidades se han incluido en su asistente de IA, Meta AI.

Enfoque

Accenture y OpenAI firman un acuerdo para impulsar la adopción de sistemas de IA agéntica en las empresas

La firma de servicios profesionales Accenture y la 'startup' de inteligencia artificial OpenAI han anunciado este lunes un acuerdo de colaboración para ayudar a las empresas incorporar sistemas de IA agéntica en sus operaciones diarias.

Y Además

Dos marcas, una misión: Satisfyer y GESKE abren sus primeras tiendas insignia en España

Tras la apertura simultánea de tres tiendas monomarca en Berlín, Satisfyer y GESKE German Beauty Tech marcan el inicio de una nueva era del autocuidado en España. La primera tienda insignia abre hoy en Madrid (Fuencarral 54, 28004 Madrid), seguida de destacadas inauguraciones en Barcelona y Valencia. Estos lanzamientos representan la entrada oficial de ambas marcas en el mercado español, consolidando su ambiciosa estrategia de expansión global en el comercio minorista.

Nota Principal

Telefónica y DAZN renuevan los derechos de LaLiga hasta 2032 por 5.250 millones

Telefónica y DAZN han resultado adjudicatarias de los derechos de emisión de la LaLiga hasta 2032 por un importe conjunto de 5.250 millones de euros.

Barcelona

El precio de la vivienda interanual sube un 14,3% en noviembre en Cataluña

El precio de la vivienda de segunda mano en Cataluña sube un 0,7% en su variación mensual y un 14,3% en su variación interanual, situando el precio medio de las viviendas ofertadas en noviembre en 3.181 euros/m2, según los datos del Índice Inmobiliario Fotocasa.

Barcelona

Ferrero Rocher reúne a los alcaldes de los 5 pueblos que pasan de fase en la 12ª edición de “Juntos Brillamos más” y muestra un ajustado ranking de votos

A pocos días de que se cierre el plazo de votación de la segunda fase, Ferrero ha logrado reunir hoy en un evento especial a los cinco alcaldes de las localidades finalistas de la iniciativa “Juntos Brillamos Más”. En un ambiente marcado por la complicidad y el espíritu colaborativo, los representantes de A Guarda (Pontevedra), Bullas (Murcia), Cudillero (Asturias), Fuente del Maestre (Badajoz) y Tejeda (Las Palmas) han defendido sus candidaturas con la ilusión de conseguir la esperada iluminación navideña de Ferrero Rocher.

Barcelona

El cine inspira a viajar: más de la mitad de los españoles elige destinos por películas o series

Más de la mitad de los españoles ha elegido en alguna ocasión un destino de vacaciones influenciado por una película o serie, según desvela un estudio realizado por HomeExchange la plataforma líder mundial de intercambio de casas. El 40% de los encuestados identifica las películas y series como su principal fuente de inspiración para viajar, por delante de agencias de viajes (16%) e influencers (11%).

Enfoque

AWS empleará la tecnología de Nvidia en sus chips y anuncia la creación de "fábricas de IA"

Amazon Web Services (AWS) y Nvidia han anunciado este martes la profundización de su "asociación estratégica", lo que incluye la adopción por parte de la primera de la tecnología NVLink Fusion de la segunda en el chip de última generación Trainium4, las GPUs Graviton o en AWS Nitro System.

Barcelona

Grand Hyatt Barcelona, El mejor hotel urbano del 2025 da el pistoletazo de salida a la temporada festiva 2025

El icónico hotel de cinco estrellas barcelonés, recientemente galardonado como Mejor Hotel Urbano 2025 por Condé Nast Traveler, celebra la temporada festiva bajo el lema The Grand Urban Spirit.

Barcelona

LEVEL se hace Mayor: inicia una nueva etapa como aerolínea y empieza a operar con su propio código IATA “LL”

LEVEL inicia una nueva etapa como aerolínea. Desde esta semana, ha empezado a operar con su propio código IATA “LL”, un nuevo hito en la historia de la compañía que impulsará su crecimiento y consolidará su posición como una de las aerolíneas de referencia en el largo radio desde Barcelona. Con este logro, LEVEL, que nació en 2017 como una marca comercial operada por Iberia, culmina su proceso de autonomía operativa como una aerolínea más de International Airlines Group (IAG).

Nota Principal

Nuevo proyecto logístico de PP-10 M-50 Leganés prevé una inversión superior a 30 millones de euros (y la creación de más de 400 nuevos empleos)

Leganés podría acoger próximamente una de las plataformas logísticas más avanzadas de la Comunidad de Madrid, con una inversión superior a 30 millones de euros y más de 32.000 metros cuadrados de superficie. El proyecto, ubicado en el ámbito PP10 en la M-50, está diseñado bajo los más altos estándares de sostenibilidad y eficiencia energética, con certificación medioambiental Green Gold.

Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Compartir con tus amigos de

Te puede interesar: