OpenAI proporciona a los desarrolladores una herramienta para integrar conversaciones naturales en tiempo real en sus aplicaciones de IA

OpenAI ha facilitado a los desarrolladores nuevas herramientas con las que personalizar sus modelos y crear aplicaciones de inteligencia artificial (IA) que incluyen conversaciones en tiempo real con voz natural e incorporen y mejoren la comprensión de imágenes.

La compañía tecnológica ha celebrado este martes en San Francisco (Estados Unidos) su evento de desarrolladores DevDay 2024, en el que ha anunciado nuevas herramientas para la personalización de sus modelos de IA.

Los desarrolladores pueden acceder a un nuevo proceso de destilación de modelos que se integra en la plataforma de OpenAI para que puedan utilizar los resultados de modelos de mayor capacidad, como o1-preview y GPT-4o, para afinar otros más pequeños y rentables, como GPT-4o mini.

Este proceso se encuentra en una nueva 'suite' que permite a los desarrolladores generar conjuntos de datos para destilación, crear y ejecutar evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en la oferta de ajuste de OpenAI.

Los desarrolladores también pueden realizar ajustes en GPT-4o con imágenes, además de con texto, con la nueva herramienta de ajuste fino de visión. De esta forma, pueden incorporar capacidades de comprensión de imágenes para ofrecer funciones de búsqueda visual o de detección de objetos.

'Prompt Caching' es una herramienta diseñada para que los desarrolladores ahorren costes y tiempo al permitir guardar en caché el contexto usado de manera frecuente en múltiples llamadas de API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, y sus versiones optimizadas.

"La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, comenzando con 1024 tokens y aumentando en incrementos de 128 tokens. Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API", explica la compañía en el blog oficial.

Una última novedad anunciada en DevDay es 'Realtime API', un recurso con el que los desarrolladores pueden crear experiencias rápidas de conversión de voz a voz en sus aplicaciones. Está actualmente en una fase de beta pública, y es similar al modo de voz avanzado de ChatGPT, admite conversaciones naturales con una de la seis voces predefinidas.

Tu opinión enriquece este artículo:

UDON abre su primer restaurante en el aeropuerto Josep Tarradellas Barcelona–El Prat

UDON Asian Food, la compañía líder en restauración asiática en España, continúa consolidando su presencia en entornos de viaje con la inauguración de su primer restaurante en el aeropuerto Josep Tarradellas Barcelona-El Prat. Se trata del cuarto local de UDON en aeropuertos españoles, todos ellos operados por Areas, tras las aperturas realizadas en las Terminales T1, T2 y T4 del aeropuerto Adolfo Suárez Madrid-Barajas.

España, el país que más dinero pierde por improvisar al aparcar

La movilidad urbana está cambiando y, con ella, la forma en la que los conductores afrontan uno de los puntos más críticos del trayecto: el aparcamiento. En ciudades cada vez más congestionadas, reguladas y con precios variables, improvisar deja de ser una opción eficiente y la planificación empieza a integrarse como parte natural del desplazamiento.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.