Tecnologia

OpenAI proporciona a los desarrolladores las herramientas necesarias para llevar

8346228014.png
8346228014.png
De esta manera, pueden integrar capacidades de comprensión de imágenes para proporcionar funciones de búsqueda visual o detección de objetos.

MADRID, 2 de octubre (Portaltic/EP) –

OpenAI ha proporcionado a los desarrolladores nuevas herramientas para personalizar sus modelos y crear aplicaciones de inteligencia (IA) incluyendo conversaciones en tiempo real con voz natural, al tiempo que integra y mejora la comprensión de la imagen fotográfica.

La compañía tecnológica celebró este martes su evento DevDay 2024 para desarrolladores en San Francisco (EE.UU. -Estados Unidos). anunció nuevas herramientas para personalizar sus modelos de IA.

Los desarrolladores pueden acceder a un nuevo flujo de trabajo de destilación de modelos integrado en la plataforma OpenAI para obtener resultados de modelos más grandes, como o1-preview. y GPT-4o, para refinar los más pequeños y rentables, como el mini GPT-4o.

Este proceso es parte de un nuevo «kit» que permite a los fabricantes desarrollar crear un conjunto de datos para destilar, cree y ejecute evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en el servicio de ajuste fino de OpenAI.

Los desarrolladores también pueden ajustar GPT-4o visualmente, además del texto, con la nueva corrección de visión de la herramienta de ajuste fino. De esta manera, pueden integrar capacidades de comprensión de imágenes para proporcionar funciones de búsqueda visual o detección de objetos. múltiples llamadas API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, así como en sus versiones optimizadas.

«La API de almacenamiento de prefijo más larga de una empresa se explica en el blog oficial.

Una innovación final anunciada durante DevDay es la «API en tiempo real», un recurso que los desarrolladores pueden crear experiencias rápidas de conversión de texto a voz en sus aplicaciones. Actualmente se encuentra en versión beta pública. Similar al modo de voz mejorado de ChatGPT, admite la conversación natural con una de las seis voces predefinidas.

TRA Digital

GRATIS
VER