OpenAI proporciona a los desarrolladores una herramienta para integrar conversaciones naturales en tiempo real en sus aplicaciones de IA

OpenAI ha facilitado a los desarrolladores nuevas herramientas con las que personalizar sus modelos y crear aplicaciones de inteligencia artificial (IA) que incluyen conversaciones en tiempo real con voz natural e incorporen y mejoren la comprensión de imágenes.

La compañía tecnológica ha celebrado este martes en San Francisco (Estados Unidos) su evento de desarrolladores DevDay 2024, en el que ha anunciado nuevas herramientas para la personalización de sus modelos de IA.

Los desarrolladores pueden acceder a un nuevo proceso de destilación de modelos que se integra en la plataforma de OpenAI para que puedan utilizar los resultados de modelos de mayor capacidad, como o1-preview y GPT-4o, para afinar otros más pequeños y rentables, como GPT-4o mini.

Este proceso se encuentra en una nueva 'suite' que permite a los desarrolladores generar conjuntos de datos para destilación, crear y ejecutar evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en la oferta de ajuste de OpenAI.

Los desarrolladores también pueden realizar ajustes en GPT-4o con imágenes, además de con texto, con la nueva herramienta de ajuste fino de visión. De esta forma, pueden incorporar capacidades de comprensión de imágenes para ofrecer funciones de búsqueda visual o de detección de objetos.

'Prompt Caching' es una herramienta diseñada para que los desarrolladores ahorren costes y tiempo al permitir guardar en caché el contexto usado de manera frecuente en múltiples llamadas de API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, y sus versiones optimizadas.

"La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, comenzando con 1024 tokens y aumentando en incrementos de 128 tokens. Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API", explica la compañía en el blog oficial.

Una última novedad anunciada en DevDay es 'Realtime API', un recurso con el que los desarrolladores pueden crear experiencias rápidas de conversión de voz a voz en sus aplicaciones. Está actualmente en una fase de beta pública, y es similar al modo de voz avanzado de ChatGPT, admite conversaciones naturales con una de la seis voces predefinidas.

Tu opinión enriquece este artículo:

El sector TIC en España premia el dominio de la IA y la ciberseguridad con sueldos de hasta 130.000 euros

El dominio de la inteligencia artificial (IA), la arquitectura de soluciones, la ciberseguridad y la capacidad de conectar tecnología con negocio son algunas de las características más demandadas en el mercado laboral del sector de las tecnologías de la información y la comunicación (TIC), unas cualidades que, en el caso de los puestos más experimentados y especializados, se premia con salarios que se mueven entre los 70.000 y los 130.000 euros, según la 'Guía salarial TIC 2026' elaborada por Adecco.

CaixaBank obtiene un beneficio neto de 5.891 millones de euros en 2025, un 1,8% más, por el fuerte crecimiento del negocio

El consejero delegado de la entidad, Gonzalo Gortázar, ha afirmado que “2025 ha sido un gran año para CaixaBank, en el que hemos superado los objetivos que nos habíamos marcado al inicio del ejercicio, con mayor crecimiento del negocio y una solidez financiera aún más robusta. Como consecuencia, hemos revisado al alza los objetivos de crecimiento y rentabilidad que habíamos fijado en nuestro Plan Estratégico”.  

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.