Con el avance de la inteligencia artificial (IA), investigadores de todo el mundo están optando por una nueva tendencia: el uso de modelos pequeños de IA que pueden ejecutarse en ordenadores portátiles o servidores locales, dejando atrás las soluciones basadas en la nube como ChatGPT. Esta transición está permitiendo a los científicos realizar investigaciones con mayor independencia, protección de datos y menores costos.

Durante años, los modelos grandes de IA, como los de OpenAI, Google y Meta, han dominado el campo, proporcionando a los usuarios acceso a potentes herramientas para el procesamiento del lenguaje y el análisis de datos. Sin embargo, estos modelos suelen requerir servidores de alto rendimiento y la utilización de recursos en la nube. En respuesta, empresas como Google DeepMind, Microsoft y Meta han comenzado a ofrecer versiones más compactas de sus modelos, que pueden ejecutarse en hardware más accesible, como ordenadores personales y servidores locales.

ChatGPT de cero a cien

Descubre el potencial de ChatGPT en tu trabajo diario.

La razón detrás de este giro es múltiple. En primer lugar, ejecutar modelos localmente permite a los investigadores ahorrar costos considerables. Los modelos alojados en la nube requieren una suscripción continua o pagos por el uso de recursos, lo que puede ser prohibitivo para instituciones académicas o pequeños equipos de investigación con presupuestos limitados.

En segundo lugar, la capacidad de operar modelos localmente significa una mayor seguridad y privacidad de los datos. En áreas como la medicina y la bioinformática, donde la protección de datos personales es fundamental, el uso de IA en entornos locales permite a los científicos trabajar sin depender de terceros para el almacenamiento de datos. En lugar de enviar información sensible a un servidor externo, los investigadores pueden mantener el control total sobre los datos, lo que reduce el riesgo de violaciones de privacidad o el mal uso de la información.

Además, el cambio a modelos más pequeños también ha mejorado la reproducibilidad de los estudios científicos. Al poder compartir los modelos y ejecutarlos en equipos comunes, otros científicos pueden replicar fácilmente los experimentos y verificar los resultados sin necesidad de acceso a costosas infraestructuras en la nube. Esto es esencial en campos que dependen de la precisión y la verificación, como la biotecnología o la investigación de nuevos medicamentos.

Mejores resultados

Otro aspecto a tener en cuenta es la accesibilidad. Los grandes modelos de IA, aunque poderosos, a menudo están fuera del alcance de muchas instituciones más pequeñas o en países en vías de desarrollo debido a los altos costos y la complejidad técnica que implican. Al poder descargar y ejecutar modelos más ligeros, los investigadores de todo el mundo tienen más oportunidades de aprovechar las últimas tecnologías en IA, democratizando el acceso y fomentando una mayor diversidad de investigación a nivel global.

Por ejemplo, áreas como la predicción del clima, el análisis de imágenes médicas o la investigación del cambio climático pueden beneficiarse enormemente de estas herramientas más accesibles. Los investigadores no solo pueden procesar datos más rápidamente, sino que también pueden ajustar los modelos a sus necesidades específicas sin depender de grandes empresas tecnológicas para el soporte continuo.

Desafíos y oportunidades

A pesar de los avances, la adopción de modelos locales no está exenta de desafíos. Una de las principales dificultades radica en la capacidad de hardware disponible. Aunque estos nuevos modelos son más compactos, aún requieren computadoras con buena capacidad de procesamiento para manejar las tareas más exigentes. Sin embargo, la rápida evolución del hardware, con el aumento en la disponibilidad de chips de procesamiento especializado como las GPUs (unidades de procesamiento gráfico) y TPUs (unidades de procesamiento tensorial), está facilitando esta transición.

Además, los modelos más pequeños suelen tener limitaciones en cuanto a la cantidad de datos que pueden procesar de manera eficiente en comparación con sus contrapartes más grandes. Sin embargo, las empresas tecnológicas han estado trabajando para optimizar estos modelos sin comprometer su rendimiento, haciendo que sean una opción viable para un amplio rango de aplicaciones.