WhiteBox: "O principal desafio de trabalhar em IA com administrações públicas é a burocracia".

O setor público tem sido muito mais lento do que outros para adotar determinadas tecnologias, devido às características inerentes à sua natureza, como a burocracia excessiva. Mas, pouco a pouco, as administrações estão integrando ferramentas que as tornam mais ágeis e eficientes para os cidadãos.

A inteligência artificial entrou em todos os tipos de instituições e órgãos públicos de maneiras muito diferentes. Para "aterrissar" alguns deles, conversamos com a startup de tecnologia WhiteBox.

David Cañones, cofundador e CTO da empresa, comenta com Neosmart os projetos que estão em andamento com o setor público no momento e os desafios que enfrentaram ao trabalhar com esse tipo de cliente.

- Como surgiu a Whitebox?

A WhiteBox se define como uma empresa que desenvolve soluções de IA personalizadas para seus clientes, com foco na excelência técnica. Ela surgiu como uma aliança entre dois técnicos (Pedro e David, os fundadores) que rejeitavam a maneira tradicional como as empresas de consultoria tecnológica operavam, com o foco sempre no lado comercial do negócio, mas sem capacidade real de implementar as soluções que haviam vendido.

Esse "modus operandi", muito comum em grandes empresas de consultoria quando uma tecnologia se torna moda (como é o caso agora da IA), leva a muito dinheiro desperdiçado em "elefantes brancos" e "clientes irritados". Ao mesmo tempo, isso cria uma janela de oportunidade para pequenas empresas com foco em excelência técnica e capacidade real de execução para conquistar um nicho no mercado.

Muitas dessas empresas "irritadas" foram nossos primeiros clientes quando começamos em 2019 e nossos primeiros projetos foram para consertar esses "elefantes brancos" que as grandes consultorias haviam deixado pela metade.

- Quais tecnologias de IA vocês usam em suas soluções e por que as escolheram em particular?

Nossas soluções são desenvolvidas em Python e sempre usam bibliotecas de código aberto da pilha padrão para ciência de dados, exceto em pouquíssimos casos (por exemplo, Power BI para criar painéis ou OpenAI para alguns LLMs). Dependendo do cliente para o qual desenvolvemos a solução, podemos implementá-la usando sua própria infraestrutura local ou qualquer nuvem pública ou privada.

O principal motivo para desenvolver nossas soluções com base em tecnologias de código aberto é que, além de ser o padrão nesse setor, a qualidade delas é muito superior a qualquer outro tipo de ferramenta proprietária. Essas ferramentas estão sujeitas ao escrutínio constante de milhares de desenvolvedores pertencentes a inúmeras organizações, e o número de horas de trabalho por trás de cada uma delas é simplesmente inatingível para uma solução proprietária desenvolvida por uma única empresa, mesmo uma com o orçamento e a capacidade tecnológica de uma Big Tech.

Nossa pilha mais comum inclui bibliotecas como pandas, polars ou Spark para o estágio de transformação de dados; bibliotecas como matplotlib, seaborn ou Plotly para a criação de visualizações; scikit-learn, LightGBM ou CatBoost para a criação de modelos preditivos clássicos; e PyTorch e TensorFlow para o desenvolvimento de modelos de Deep Learning, entre muitas outras.

- Como você começou a trabalhar com a Administração Pública? Isso estava entre seus objetivos ou planos quando criou a empresa?

Começamos a trabalhar naturalmente, mas fomos muito ajudados pela DataMarket, uma spin-off da WhiteBox dedicada à extração e comercialização de conjuntos de dados. Entre os conjuntos de dados que extraímos e mantemos estão alguns de grande interesse para o setor público, como um sobre preços de alimentos que se tornou muito popular nos meses seguintes à eclosão da guerra ucraniana (quando os preços dos alimentos dispararam e o governo estava tomando medidas para contê-los).

Isso nos levou a ter algumas conversas com técnicos de várias administrações, que mais tarde resultaram em alguns contratos menores e, em médio prazo, fomos convidados a participar de algumas licitações públicas maiores. O mesmo sucesso também se repetiu em nível europeu, onde trabalhamos com o Instituto Europeu de Tecnologia (EIT), e até mesmo nos Estados Unidos, onde chegamos a participar de projetos de inovação no campo militar para o Departamento de Defesa (DoD) junto com um parceiro local (uma condição necessária para poder contratar lá).

- Você pode nos contar sobre seus projetos atuais nesse campo e em que consiste cada um deles? Quem são seus clientes?

Atualmente, estamos trabalhando para o Conselho Municipal de Madri, o Conselho Municipal de Móstoles, o Conselho Provincial de Bizkaia e o Instituto Europeu de Tecnologia.

No caso das entidades públicas nacionais, elas estão muito interessadas em soluções de IA que as ajudem a gerenciar melhor a enorme burocracia a que estão sujeitas. O nível de documentação gerada e processada por esses tipos de entidades é simplesmente enorme, e qualquer ferramenta que lhes permita ser mais eficientes nessa área terá um enorme retorno para elas.

Um dos projetos em que estamos trabalhando com eles é a implementação do BidGenius, nosso chatbot para a geração automática de licitações públicas, com acesso a todo o BB.DD de licitações do Estado, e que é capaz de economizar meses de trabalho de redação para os técnicos das diversas administrações, além de reduzir erros e erros de digitação.

Outro caso muito popular é a avaliação e a extração de informações de documentos recebidos por essas administrações. Isso abrange um espectro muito amplo, desde a detecção de informações pessoais em documentos e sua anonimização até a classificação automática dos documentos recebidos e a verificação de que eles contêm todas as informações necessárias para um gerenciamento específico e, nesse caso, o envio para um e-mail específico para gerenciamento posterior.

- Qual foi o feedback que vocês receberam dos órgãos públicos e como isso influenciou o desenvolvimento dos produtos?

Devido à nossa cultura de trabalho, tendemos a interagir muito com os clientes durante o desenvolvimento das soluções que implementamos e, no caso da Administração Pública, isso não foi exceção.

Recebemos muito feedback para aprimorar nossas soluções durante o desenvolvimento, bem como comentários e recomendações muito bons após a conclusão dos projetos. Isso tem sido fundamental, pois, embora tenhamos acumulado muita experiência no desenvolvimento de projetos no setor privado, entender as necessidades e as particularidades do setor público tem sido uma importante experiência de aprendizado.

- Que medidas vocês tomam para garantir a transparência e evitar preconceitos nos algoritmos de IA que desenvolvem?

Dependendo do tipo de modelo, as ações a serem tomadas variam muito, mas, em geral, as medidas para garantir a transparência e evitar o viés em nossos algoritmos incluem a diversificação e a limpeza dos dados de entrada, técnicas avançadas de treinamento (equilíbrio de classes, amostragem estratificada etc.) e monitoramento, testes completos de imparcialidade, documentação detalhada e publicação de relatórios de impacto. Além disso, sempre que possível, promovemos análises externas dos modelos.

- Quais são os principais desafios ou dificuldades que você encontrou ao trabalhar com a PA e que não encontrou com outros tipos de clientes?

O principal desafio que encontramos é a enorme quantidade de regulamentação e burocracia a que as administrações públicas estão sujeitas. Isso afeta tudo, desde o tipo de modelos que podem ser usados, onde eles são hospedados geograficamente (bem como as informações que os alimentam) e assim por diante. Outro fator importante é a dificuldade de contratar com a administração pública (que é apenas outro lado do mesmo prisma regulatório).

Em uma empresa privada, é possível escolher facilmente com quais fornecedores trabalhar, mas no caso da administração pública isso não acontece. Para garantir a transparência no uso dos recursos públicos, qualquer projeto precisa passar por um processo de licitação que, em geral, é tão burocrático que apenas empresas especializadas em participar desse tipo de licitação e com equipes inteiras dedicadas a ele se candidatam (por exemplo, as grandes empresas de consultoria, as big four etc.). Todos nós já vimos o resultado: baixa qualidade a preços exorbitantes para o contribuinte (os Renfecitos).

- Como você acha que os órgãos ou as instituições públicas podem aproveitar ao máximo a IA generativa em particular?- Como você acha que os órgãos ou as instituições públicas podem aproveitar ao máximo a IA generativa em particular?

A resposta a essa pergunta é muito ampla, pois na Espanha, em particular, temos uma grande variedade de empresas públicas de diferentes verticais (transporte, saúde, segurança, administração etc.) e todas elas serão afetadas de uma forma ou de outra. Sem ir mais longe:

No setor de saúde, já existem algoritmos para apoiar técnicas de diagnóstico por imagem que tornam os radiologistas mais produtivos e os ajudam a cometer menos erros. Isso também está sendo estendido a outros tipos de profissionais, como anatomia patológica ou diagnóstico e tratamento de câncer. Dentro de alguns anos, todas essas técnicas terão que estar disponíveis no sistema de saúde pública para que ele continue competitivo.

No setor de administração, a IA generativa pode ajudar a aumentar a velocidade e a qualidade do atendimento ao cidadão com assistentes virtuais (de qualidade e capacidade quase humanas, não o trabalho de má qualidade que tem sido feito até agora nesse campo) e também a economizar muito trabalho administrativo para os próprios técnicos (com sistemas de geração e avaliação de documentos).

- O setor público, dadas as suas características, teve muito mais dificuldade para se digitalizar do que outros. Você acha que a IA pode acelerar ou está acelerando esse salto?

No momento, é muito cedo para poder avaliar. O que posso dizer é que há uma vontade clara por parte das APs de não perder o barco dessa tecnologia e que elas estão investindo muito esforço (e dinheiro) nela. O desafio, em minha opinião, é acertar e não repetir os erros que foram cometidos no passado.

Embora possamos não ter essa sensação, a Espanha não está mal posicionada em nível europeu e mundial em termos de digitalização da AP (medindo o número de procedimentos que podem ser realizados digitalmente), o problema é a qualidade das ferramentas desenvolvidas e, em muitas ocasiões, sua redundância e fragmentação.

Sem ir mais longe, um exemplo claro é a forma de autenticação em qualquer plataforma de AP, para a qual existem 4 ou 5 formas diferentes de fazê-lo (certificado digital, e-dni, senha, etc.) e nenhuma delas funciona realmente bem.

- O que você aprendeu trabalhando todo esse tempo com a Administração?

Aprendemos, por um lado, a ser pacientes com os tempos e procedimentos da administração, que, por sua própria natureza, é mais rígida do que as empresas privadas.

Por outro lado, também aprendemos que qualquer projeto capaz de gerar uma melhoria real e sustentada tem um impacto enorme que é amplificado pelo grande porte da AP. Isso também é muito gratificante, pois o mercado final de serviços governamentais é enorme. Basicamente, melhorar a administração é ter um impacto real em quase 50 milhões de pessoas, e isso não é algo que se consegue com qualquer cliente.

- Como você espera que seja a interseção entre a administração pública e a IA daqui a cinco anos? As coisas vão mudar muito e haverá muita referência cruzada de dados entre diferentes agências?

Muito progresso está sendo feito em termos de interoperabilidade dos sistemas governamentais, mas ainda há um longo caminho a percorrer. Já vi problemas até mesmo no compartilhamento de informações entre hospitais pertencentes à mesma comunidade autônoma. Em outras áreas, houve muito mais progresso, como, por exemplo, a conexão entre informações bancárias e a Agência Tributária, por exemplo. As iniciativas de dados abertos também estão lentamente começando a se firmar e as administrações estão começando a entender que esse é o caminho a seguir.

Ao mesmo tempo, ainda há uma certa opacidade em relação a determinados dados que a AP não está interessada em compartilhar ou facilitar o acesso. Projetos como o de Jaime Gómez-Obregón estão exercendo pressão nesse sentido e aumentando a conscientização pública sobre essas questões.

Quanto à IA, ainda é muito cedo para avaliar o impacto que ela terá sobre o LLL, mas é previsível que seja equivalente ao impacto que terá sobre o restante do tecido produtivo espanhol.

O compromisso das APs de começar a trabalhar com essa tecnologia é muito claro. Um padrão interessante que estamos observando é que as administrações mais locais (prefeituras) são as primeiras a começar a integrar essa tecnologia com sucesso, apesar de não terem os mesmos recursos e grandes orçamentos que as administrações regionais e centrais. Esse é um exemplo claro do fato de que, em muitas ocasiões, a vontade, a determinação e a motivação são mais importantes quando se trata de sucesso.

As empresas de tecnologia que colaboram com os governos devem obedecer a um processo de licitação altamente burocrático.

Inscreva-se gratuitamente e acesse artigos ilimitados

Você também pode gostar

Camino de Europa apresenta sua plataforma tecnológica para conectar peregrinos com produtores locais

YouTube Shorts integrará o Veo, o modelo de vídeo com IA do Google

O LinkedIn usou dados de usuários para treinar IA sem atualizar seus termos de serviço

Participe de nosso Newsletter!

USA

Europa