Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Meta ha presentado su primer modelo de lenguaje multimodal Llama 3.2, compuesto por los modelos de pequeño y mediano tamaño 11B y 90B, capaces de procesar tanto imágenes como texto, y por los modelos livianos de solo texto 1B y 3B. 

Image description

En el marco de su evento Meta Connect 2024, la tecnológica ha dado a conocer sus últimas novedades, incluido su nuevo modelo de lenguaje, que llega dos meses después de la presentación de Llama 3.1, y que introduce la capacidad de procesar imágenes por primera vez en la compañía. 

Así, el nuevo modelo Llama 3.2 se compone de dos modelos multimodales pequeño y mediano, con 11.000 millones de parámetros (11B) y 90.000 millones de parámetros (90B) respectivamente. En este sentido, los casos de uso de estos nuevos modelos admiten razonamiento de imágenes, como puede ser la comprensión de gráficos y diagramas o subtítulos de imágenes. Asimismo, también procesan la localización direccional de objetos en imágenes.

 Es decir, este modelo permite llevar a cabo acciones como extraer detalles de una fotografía, comprender la escena y, tras ello, crear oraciones que podrían utilizarse como título de la imagen o inicio para contar una historia. 

Igualmente, Llama 3.2 se completa con dos modelos de menor tamaño, 1B y 3B, que procesan texto exclusivamente y están ideados para funcionar en dispositivos, como un smartphone. Estos modelos están optimizados para procesadores ARM y pueden resolver múltiples tareas con una latencia mínima, asimismo, admiten una longitud de contexto de 128.000 tokens. 

En concreto, estos modelos permiten a los desarrolladores crear aplicaciones personalizadas en el dispositivo, asegurando los datos se mantienen privados dentro del 'smartphone' o producto en cuestión. Por ejemplo, Meta ha señalado que pueden utilizarse para llevar a cabo resúmenes de los diez últimos mensajes recibidos en una 'app' de mensajería instantánea. Igualmente, pueden aplicarse para enviar de forma automática invitaciones de calendario para organizar reuniones. 

Sin embargo, la tecnológica ha señalado que estos modelos destacan, sobre todo, por su capacidad de ejecutarse localmente. Por un lado, esta función permite que las indicaciones o respuestas del modelos sean instantáneas, ya que se procesan localmente. Por otra parte, garantiza una privacidad total, al no enviar datos como mensajes o información del calendario a la nube. 

COMPETITIVOS CON CLAUDE 3 HAIKU GPT4O-MINI 

Según la evaluación de estos modelos ofrecida por Meta, los modelos 3.2 11B y 90B son competitivos con los modelos básicos líderes, Claude 3 Haiku y GPT4o-mini en el reconocimiento de imágenes y una variedad de tareas de comprensión visual. 

Por su parte, el modelo 3B supera a los modelos Gemma 2 2.6B y Phi 3.5-mini a la hora de ejecutar tareas como seguir instrucciones, resumir, reescribir indicaciones y usar herramientas. Igualmente, el modelo 1B es en este ámbito con Gemma. 

Para llegar a estas conclusiones, Meta evaluó el rendimiento de los modelos en más de 150 conjuntos de datos de referencia que, abarcando una amplia variedad de idiomas. 

Con todo ello, la compañía ha señalado que el modelo de lenguaje grande Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, de cara a que empiecen a probar y experimentar sus posibilidades. Asimismo, todas estas capacidades se han incluido en su asistente de IA, Meta AI.

Tu opinión enriquece este artículo:

Uno de cada tres españoles afirma que le resulta difícil desconectar del trabajo

La vuelta al cole y la rutina siempre ha sido el momento escogido por los españoles para hacer balance del año en términos de salud. Tras el verano, las personas tienden a encontrarse más descansadas, situación que repercute directamente en el trabajo. Sin embargo, con la vuelta al trabajo, los empleados y empleadas vuelven a ver afectada su salud por problemas en el entorno laboral y el estrés del día a día.

El 84% de los autónomos españoles asegura que su trabajo ha afectado su nivel de estrés y ansiedad

Elegir la profesión a la que te quieres dedicar a lo largo de la vida no es una tarea sencilla. Nos enfrentamos a optar por ir a la universidad, elegir un grado de formación profesional o ponernos directamente a trabajar y, a posteriori, decidimos si queremos opositar, emprender, trabajar por cuenta propia o por cuenta ajena. Todos estos caminos van a marcar nuestra trayectoria profesional, pero también van a dejar huella en la personal.

Barcelona se convierte en la sede mundial de la nueva economía con el BNEW hasta el 10 de octubre

Con la presencia de asistentes de 106 países, 350 speakers de primer nivel y más de 100 sesiones de contenido, durante 4 días el BNEW, Barcelona New Economy Week , convertirá a la Perla del Mediterraneo, en la capital de la economía del futuro. El evento en formato innovador,  permite que el contenido de calidad llegue a cualquier persona desde la parte del mundo donde desee conectarse, mientras que esa misma persona puede hacer networking con el resto de participantes, a través de la plataforma digital. Todo desde la mismísima “Fábrica del Futuro”, como le llaman al DFactory, ubicado en la Zona Franca del Puerto de la capital catalana desde donde se desarrollará el evento.

El auge de las energías renovables fomenta la movilidad internacional de trabajadores en Europa

A raíz de los avances tecnológicos, especialmente después de la pandemia de COVID-19 que generó un gran crecimiento de la digitalización de las actividades profesionales, los procesos migratorios y las modalidades de trabajo a distancia se han visto fuertemente impulsados en los últimos años. Una tendencia que es particularmente notable en el sector energético, tal y como muestran los datos revelados por el estudio sobre la situación de la movilidad internacional de los trabajadores, realizado por EMS - Employee Mobility Solutions. 

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.