El sector público ha tardado mucho más que otros en abrazar ciertas tecnologías, debido a las características inherentes a su naturaleza, como su exceso burocrático. Pero, poco a poco, las Administraciones integran herramientas que las hacen más ágiles y eficientes para los ciudadanos.
La inteligencia artificial ha irrumpido en todo tipo de instituciones y organismos públicos de formas muy dispares. Para 'aterrizarnos' algunas de ellas hemos podido hablar con la startup tecnológica WhiteBox.
David Cañones, co-fundador y CTO-de la compañía repasa con Neosmart los proyectos que tienen en marcha con el sector público en este momento y los retos que les ha planteado trabajar con este tipo de clientes.
- ¿Cómo surgió Whitebox?
- WhiteBox se define como una firma que desarrolla soluciones de IA a medida de sus clientes, con el foco puesto en la excelencia técnica. Surge como una alianza entre dos técnicos (Pedro y David, los fundadores) que rechazaban la forma tradicional en la que las empresas de consultoría tecnológica operaban, con el foco siempre puesto en la parte comercial del negocio, pero sin capacidad real para luego implementar las soluciones que habían vendido.
Este "modus operandi", muy habitual en las grandes firmas de consultoría cuando una tecnología se pone de moda (como es el caso ahora con la IA), provoca multitud de dinero malgastado en "elefantes blancos" y "clientes furiosos". Al mismo tiempo, crea una ventana de oportunidad para que pequeñas empresas con el foco puesto en la excelencia técnica y la capacidad real de ejecución puedan hacerse un hueco en el mercado.
Muchas de esas empresas "furiosas" fueron nuestros primeros clientes cuando comenzamos en 2019 y nuestros primeros proyectos consistieron en arreglar esos "elefantes blancos" que las grandes consultoras habían dejado a medio terminar.
- ¿Qué tecnologías de IA utilizáis en vuestras soluciones y por qué elegisteis estas en particular?
- Nuestras soluciones se desarrollan en Python y siempre utilizando librerías open-source del stack estándar para Data Science, salvo en muy contadas ocasiones (como, por ejemplo, Power BI para la creación de dashboards u OpenAI para algunos LLMs). En función del cliente para el que desarrollemos la solución, podemos implementarla utilizando tanto su infraestructura propia on-premise, como cualquier cloud pública o privada.
El principal motivo de desarrollar nuestras soluciones construyendo sobre tecnologías Open Source es que, además de ser el estándar en este sector, la calidad de las mismas está muy por encima de cualquier otro tipo de herramienta privativa. Estas herramientas están sometidas al escrutinio constante de miles de desarrolladores pertenecientes a infinidad de organizaciones, y el número de horas de trabajo que hay detrás de cada una de ellas es simplemente inalcanzable para una solución privativa desarrollada por una única empresa, aunque se trate de una con el presupuesto y capacidad tecnológica de una Big Tech.
En nuestro stack más común se encuentran librerías como pandas, polars o Spark para la etapa de transformación de los datos; librerías como matplotlib, seaborn o Plotly para la creación de visualizaciones; scikit-learn, LightGBM o CatBoost para la creación de modelos predictivos clásicos; y PyTorch y TensorFlow para el desarrollo de modelos de Deep Learning, entre muchas otras.
- ¿Cómo comenzasteis a trabajar con la Administración Pública? ¿Estaba entre vuestros objetivos o planes cuando montasteis la compañía?
- Comenzamos a trabajar de forma natural, pero nos ayudó mucho DataMarket, una spin-off de WhiteBox dedicada a la extracción y comercialización de datasets. Entre los datasets que extraemos y mantenemos, se encuentran algunos de gran interés para el sector público, como uno sobre los precios de los alimentos que alcanzó gran popularidad durante los meses posteriores al inicio de la guerra de Ucrania (en la que estos precios se dispararon y el gobierno tomaba medidas para contenerlos).
Esto nos llevó a tener algunas conversaciones con técnicos de varias administraciones, lo que posteriormente se tradujo en algún contrato menor y a medio plazo fuimos invitados a participar en algunas licitaciones públicas de mayor envergadura. El mismo éxito lo repetimos también a nivel europeo, donde trabajamos con el Instituto Europeo de la Tecnología (EIT), e incluso en Estados Unidos, donde hemos llegado a participar en proyectos de innovación en el ámbito militar para el Departamento de Defensa (DoD) junto con un partner local (condición necesaria para poder contratar allí).
- ¿Podéis detallarnos qué proyectos tenéis ahora en este ámbito y en qué consiste cada uno de ellos? ¿Quiénes son vuestros clientes?
- En este momento estamos trabajando para el Ayuntamiento de Madrid, el Ayuntamiento de Móstoles, la Diputación Foral de Bizkaia y el Instituto Europeo de la Tecnología.
En el caso de las entidades públicas nacionales, están muy interesadas en soluciones de IA que les ayuden a gestionar mejor la enorme burocracia a la que están sometidas. El nivel de documentación que generan y procesan este tipo de entidades es simplemente descomunal, y cualquier herramienta que les permita ser más eficientes en ese ámbito va a tener un retorno bestial para ellos.
Entre los proyectos que estamos haciendo con ellos, destaca la implantación de BidGenius, nuestro chatbot de generación automática de licitaciones públicas, con acceso a toda la BB.DD de licitaciones del Estado, y que es capaz de ahorrar meses de trabajo de redacción a los técnicos de las diversas administraciones, reduciendo al mismo tiempo los fallos y las erratas en las mismas.
Otro caso muy popular es la evaluación y extracción de información de documentos que reciben estas administraciones. Esto cubre un espectro muy amplio, desde detectar información personal en documentos para luego anonimizarla, hasta clasificar los documentos que reciben de forma automática y verificar que se cuenta con todos los necesarios para una gestión específica, y en ese caso enviarlos a un correo específico para su posterior gestión.
- ¿Qué feedback habéis recibido de los organismos públicos y cómo ha influido esto en el desarrollo de los productos?
- Por nuestra cultura de trabajo solemos interactuar mucho con los clientes durante el desarrollo de las soluciones que implementamos y, en el caso de la Administración Pública, esto no ha sido una excepción.
Hemos recibido mucho feedback para mejorar nuestras soluciones durante el desarrollo de las mismas, así como muy buenos comentarios y recomendaciones tras la finalización de los proyectos. Esto ha sido fundamental, ya que aunque acumulábamos muchísima experiencia desarrollando proyectos en el sector privado, entender correctamente las necesidades y particularidades del sector público ha supuesto un aprendizaje importante.
- ¿Qué medidas tomáis para asegurar la transparencia y evitar sesgos en los algoritmos de IA que desarrolláis?
- Dependiendo del tipo de modelo, las acciones a tomar varían bastante, pero en general, entre las medidas para asegurar la transparencia y evitar sesgos en nuestros algoritmos se incluyen la diversificación y limpieza de los datos de entrada, técnicas avanzadas de entrenamiento (balanceo de clases, muestreos estratificados, etc.) y monitoreo, pruebas exhaustivas de equidad, documentación detallada, y publicación de informes de impacto. Además, cuando es posible, promovemos revisiones externas de los modelos.
- ¿Qué principales desafíos o retos os habéis encontrado al trabajar con la AP que no tenéis con otro tipo de clientes?
- El principal desafío con el que nos hemos encontrado es la enorme cantidad de regulaciones y burocracia a las que las administraciones públicas están sometidas. Esto afecta a todo, desde el tipo de modelos que se pueden utilizar, dónde se encuentran alojados geográficamente (así como la información que los alimenta), etc. Otro factor importante es la dificultad para poder contratar con la administración pública (que no es más que otra cara del mismo prisma regulatorio).
En una empresa privada se tiene la libertad de escoger de forma sencilla con qué proveedores trabajar, pero en el caso de la Administración Pública no es así. Para asegurar la transparencia en el uso de los fondos públicos, cualquier proyecto tiene que pasar por un proceso de licitación que suele ser tan burocrático que únicamente empresas especializadas en participar en este tipo de licitaciones y con equipos enteros dedicados a ello se presentan (por ejemplo, las grandes consultoras, big four, etc.). El resultado ya lo hemos visto todos: baja calidad a precios desorbitados para el contribuyente (los Renfecitos).
- ¿Cómo pensáis que los organismos públicos o instituciones pueden sacar el mayor partido a la IA generativa en particular?
- La respuesta a esta pregunta es muy amplia, ya que en España en concreto contamos con un gran abanico de empresas públicas de diferentes verticales (transporte, salud, seguridad, administración, etc.) y todas ellas se van a ver impactadas de una forma u otra. Sin ir más lejos:
En el sector salud existen ya algoritmos de soporte a técnicas de diagnóstico por imagen que hacen a los radiólogos más productivos y les ayudan a cometer menos errores. Esto además se está extendiendo a otro tipo de profesionales, como por ejemplo la anatomía patológica o el diagnóstico y tratamiento del cáncer. De aquí a unos años, todas estas técnicas deberán estar disponibles en el sistema de salud público para que este siga siendo competitivo.
En el sector de la administración, la IA generativa puede ayudar desde mejorando la velocidad y calidad de la atención al ciudadano con asistentes virtuales (de calidad y capacidad quasi-humana, no las chapuzas que se han venido haciendo hasta ahora en este ámbito) como también ahorrando mucho trabajo administrativo a los propios técnicos (con sistemas de generación y valoración documental).
- Al sector público, dadas sus características, le ha costado mucho más la digitalización que a otros. ¿Pensáis que la IA puede acelerar o está acelerando este salto?
- De momento es pronto para poder valorar. Lo que sí puedo decir es que hay una voluntad clara por parte de las AP de no perder el tren de esta tecnología, y de que están invirtiendo mucho esfuerzo (y dinero) en ello. El reto, en mi opinión, está en hacerlo bien y no repetir los errores que se han cometido en el pasado.
Aunque no nos dé esa sensación, España no se encuentra mal posicionada a nivel europeo y mundial en cuanto a digitalización de la AP (midiendo el número de trámites que se pueden hacer digitalmente), el problema es la calidad de las herramientas desarrolladas y en muchas ocasiones la redundancia y fragmentación de las mismas.
Sin ir más lejos, un claro ejemplo es la forma de autenticarse en cualquier plataforma de la AP, para lo que hay 4 o 5 formas diferentes de hacerlo (certificado digital, dni-e, clave, etc.) y ninguna de ellas funciona realmente bien.
- ¿Qué habéis aprendido trabajando todo este tiempo con la Administración?
- Hemos aprendido, por una parte, a tener paciencia con los tiempos y los procedimientos de la administración, que por su propia naturaleza es más rígida que las empresas privadas.
Por otra parte, también hemos aprendido que cualquier proyecto capaz de generar una mejora real y sostenida en la misma, acaba teniendo un impacto descomunal que se ve amplificado por el gran tamaño de la AP. Esto además es muy gratificante, porque el mercado final al que van dirigidos los servicios de la administración es enorme. Básicamente, mejorar la administración es tener un impacto real sobre casi 50 millones de personas, y eso no es algo que se pueda conseguir en cualquier cliente.
- ¿Cómo esperáis que sea la intersección entre la Adm. Pública y la IA de aquí a 5 años? ¿Van a cambiar mucho las cosas? ¿Habrá muchos cruces de datos entre distintos organismos?
- Se está avanzando mucho en cuanto a la interoperabilidad de los sistemas de la administración, pero todavía queda muchísimo por hacer. He llegado a ver problemas para compartir información entre hospitales pertenecientes a la misma comunidad autónoma. En otros ámbitos se ha avanzado mucho más, como por ejemplo en la conexión entre la información bancaria y la Agencia Tributaria, sin ir más lejos. Las iniciativas de datos abiertos también empiezan a calar poco a poco y las administraciones empiezan a entender que ese es el camino a seguir.
Al mismo tiempo, sigue existiendo cierta opacidad con respecto a ciertos datos que a la AP no le interesa compartir o facilitar su acceso. Proyectos como el de Jaime Gómez-Obregón están presionando en ese sentido y sensibilizando a la población sobre estos temas.
En cuanto a la IA, en este momento es todavía pronto para evaluar el impacto que tendrá en las AP, pero es previsible que será equivalente al que tendrá en el resto del tejido productivo español.
La apuesta de las AP por comenzar a trabajar con esta tecnología es muy clara. Un patrón interesante que estamos viendo es que las administraciones más locales (ayuntamientos) son las primeras que están comenzando a integrar esta tecnología de forma exitosa, a pesar de que no cuentan con los mismos medios y los abultados presupuestos que las administraciones autonómicas y central tienen. Esto es un claro ejemplo de que, en muchas ocasiones, es más importante la voluntad, la determinación y la motivación a la hora de tener éxito.