El OpenAI DevDay 2024 marca un nuevo punto de inflexión en la trayectoria de la empresa liderada por Sam Altman, destacando un cambio estratégico centrado en hacer la inteligencia artificial más accesible y asequible para los desarrolladores. Este evento reveló cuatro nuevas creaciones clave diseñadas para facilitar el uso de la IA en diversas aplicaciones.
Prompt caching
Una de las primeras novedades anunciadas fue el Caché de Prompts, una herramienta que promete mejorar la eficiencia y reducir los costes para los desarrolladores. Esta función aplica automáticamente un descuento del 50% en los tokens de entrada que el modelo ya ha procesado anteriormente. La reutilización de estos tokens no solo mejora la velocidad de procesamiento, sino que también puede generar ahorros considerables, especialmente en aplicaciones que requieren consultas repetitivas.
Vision Fine-Tuning
OpenAI también presentó el Ajuste Fino de Visión para su modelo GPT-4o. Esta nueva capacidad permite a los desarrolladores adaptar las funcionalidades visuales del modelo utilizando conjuntos de datos de imágenes y texto relativamente pequeños. Esta mejora abre un abanico de posibilidades para industrias como la conducción autónoma, la medicina basada en imágenes y la búsqueda visual avanzada.
Un ejemplo destacado es la empresa de transporte Grab, en el sudeste asiático, que reportó mejoras del 20% en la precisión del conteo de carriles y un 13% en el reconocimiento de señales de límite de velocidad, utilizando solo 100 ejemplos de entrenamiento.
Realtime API
Otro anuncio significativo fue el lanzamiento de la beta pública de la API en Tiempo Real, diseñada para permitir conversaciones de voz a voz de manera casi instantánea. Esta herramienta ofrece a los desarrolladores la posibilidad de crear experiencias de conversación natural, utilizando una selección de seis voces proporcionadas por OpenAI. Además, la API en Tiempo Real puede integrarse con herramientas adicionales para llevar a cabo tareas complejas, como la anotación de mapas con ubicaciones específicas mientras se responde a las consultas del usuario.
Model Distillation
Quizás lo mejor que se ha presentado en este DevDay fue la Destilación de Modelos, una técnica que permite a los desarrolladores entrenar modelos más pequeños y eficientes utilizando los resultados de modelos más grandes y poderosos. Esta metodología es especialmente útil para las empresas que buscan optimizar sus recursos sin sacrificar el rendimiento.
Por ejemplo, los desarrolladores pueden emplear modelos de gran tamaño como GPT-4o o o1-preview para mejorar modelos más pequeños y ligeros, como GPT-4o mini. Este enfoque no solo reduce la carga computacional, sino que también permite el despliegue de soluciones de IA en dispositivos con limitaciones de recursos.
Mayor accesibilidad
Además, OpenAI reiteró su compromiso con la accesibilidad, destacando que ha logrado reducir los costes de acceso a su API en un 99% durante los últimos dos años. Esta reducción drástica de precios representa una oportunidad única para startups y empresas emergentes que anteriormente no podían permitirse implementar soluciones de IA debido a los altos costes.