Empresas de IA: como avaliar + 4 camadas do mercado

Moveo AI Team

in

🤖 AI automation

Toda semana, alguma empresa anuncia que está adotando IA. Os executivos responsáveis pela decisão recebem propostas de dezenas de fornecedores diferentes e, na maioria das vezes, colocam todos na mesma planilha de avaliação.

O resultado quase sempre é o mesmo: projetos que funcionam em demo e travam em produção, ou contratos assinados com a percepção crescente de que a solução escolhida não resolve o problema real.

O erro raramente é tecnológico. É de enquadramento. Comparar empresas de inteligência artificial sem entender em qual camada do mercado cada uma opera é como colocar um motor de avião, um sistema de navegação e uma companhia aérea na mesma shortlist.

São categorias distintas, com propostas de valor completamente diferentes.

Por que mais de 40% dos projetos de IA agentica serão cancelados até 2027

Em junho de 2025, o Gartner publicou uma previsão baseada em pesquisa com mais de 3.400 organizações: mais de 40% dos projetos de IA agêntica serão cancelados até 2027, por custos crescentes, valor de negócio indefinido e controles de risco inadequados. A analista sênior Anushree Verma foi direta: a maioria dos projetos em andamento é conduzida por hype, não por estratégia.

Um estudo conjunto do MIT Sloan Management Review e da BCG, publicado em novembro do mesmo ano, reforça o diagnóstico: a IA agência atingiu 35% de adoção em apenas dois anos, o ritmo mais rápido de qualquer onda de IA até hoje. Porém, a grande maioria das implementações permanece travada em fase piloto. Em qualquer função de negócio avaliada, menos de 10% das organizações relataram escalar agentes de fato.

O problema não é a tecnologia, é a escolha do tipo errado de fornecedor

O Gartner identificou três causas principais de cancelamento: custos escalando sem controle, ausência de valor de negócio mensurável e falta de governança adequada.

As três têm uma raiz comum: empresas que escolheram uma plataforma genérica para resolver um problema que exige especialização vertical, ou que adquiriram capacidade de modelo de fundação sem a camada de aplicação que transforma essa capacidade em resultado.

Entender como o mercado de empresas de IA está estruturado é o pré-requisito para qualquer decisão de compra bem fundamentada.

As 4 camadas do mercado de empresas de inteligência artificial

O ecossistema de IA não é uma lista plana de fornecedores concorrentes. É uma pilha de camadas interdependentes, cada uma com função, proposta de valor e critérios de avaliação distintos.

Saber em qual camada cada empresa opera é o primeiro filtro de qualquer processo de seleção sério.

Camada 1: Modelos de fundação

São as empresas que desenvolvem e treinam os grandes modelos de linguagem, a infraestrutura cognitiva sobre a qual todo o resto é construído. Os principais players globais são OpenAI, Anthropic, Google DeepMind, Meta (Llama) e Mistral.

O mercado de modelos de fundação concentrou US$ 80 bilhões em captação somente em 2025, e a disputa por participação no gasto corporativo é intensa. De acordo com a Menlo Ventures, a Anthropic saltou de 12% para 40% do gasto empresarial com LLMs entre 2023 e 2025, enquanto a OpenAI caiu de 50% para 27% no mesmo período.

Esses números revelam algo importante: a camada de modelos de fundação está em permanente redistribuição.

Para quem compra soluções de IA, a lição prática é que escolher um modelo de fundação não é o mesmo que escolher uma solução. É escolher o motor, não o veículo.

A maioria das empresas não precisa contratar diretamente uma empresa de modelos de fundação, mas precisa saber qual modelo alimenta as plataformas que está avaliando.

Camada 2: Plataformas horizontais de IA

São soluções de IA aplicadas a fluxos corporativos amplos, sem foco em indústria ou função específica. Microsoft Copilot, Google Gemini Enterprise, Salesforce Einstein e ServiceNow AI são os exemplos mais comuns no mercado corporativo brasileiro.

Plataformas horizontais ganham espaço em demos executivos porque parecem amplamente úteis: qualquer departamento pode usar, a integração com suítes já existentes é relativamente fluida e o tempo de implantação inicial tende a ser curto.

O problema aparece depois. Como apontam pesquisadores da Codebridge, agentes horizontais vencem demos de executivos, mas agentes verticais vencem decisões de compra, porque são mais fáceis de governar e medir em operações específicas.

Para operações transversais de produtividade sem regulação setorial crítica, como criação de conteúdo, suporte interno e resumo de documentos, plataformas horizontais fazem sentido. Para processos regulados, de alta complexidade e com KPIs financeiros diretos, raramente entregam o resultado esperado sem customização extensa.

Camada 3: Especialistas verticais de IA

São empresas construídas para uma indústria ou função específica, com conhecimento de domínio pré-embutido, integrações nativas com sistemas do setor e governança regulatória incorporada por design. O mercado jurídico tem Harvey AI. O de saúde tem Abridge e Rad AI.

Nos serviços financeiros, cobrança e gestão de recebíveis, a Moveo.AI opera como especialista vertical na categoria de Customer-to-Cash, unindo Serviço ao Cliente, Contas a Receber e Cobrança em uma única arquitetura com memória persistente.

A Bessemer Venture Partners projeta que o mercado de IA vertical pode ser 10 vezes maior que o SaaS legado, e a AIM Research estima que esse segmento ultrapassará US$ 100 bilhões até 2032.

A vantagem competitiva dos especialistas verticais não é só técnica: é temporal. Implementações de IA vertical tipicamente entregam resultados iniciais em semanas, não nos meses necessários para customizar um modelo generalista para um contexto específico.

O Gartner prevê que 80% das empresas adotarão agentes verticais de IA até 2026, um indicativo de que a especialização está se tornando critério de compra padrão, não diferencial de nicho.

Camada 4: Infraestrutura e MLOps

É o substrato que faz os agentes funcionarem em produção com rastreabilidade, custo controlado e conformidade auditável. Nessa camada estão NVIDIA e CoreWeave (computação), AWS, Azure e GCP (cloud), além de plataformas de observabilidade de IA como Arize e Maxim.

Para líderes de negócios avaliando soluções de IA, a camada de infraestrutura raramente entra diretamente na decisão de compra. Mas ela importa indiretamente: quase metade dos executivos entrevistados pelo IBM Institute for Business Value em 2025 citou a falta de visibilidade nos processos de decisão dos agentes como barreira central de implementação.

Isso significa que qualquer plataforma de IA que não ofereça rastreabilidade de decisões em produção está colocando o cliente nessa estatística.

Como avaliar empresas de IA por camada? 5 perguntas que separam fornecedores sérios do hype

Saber que o mercado tem quatro camadas não resolve o problema sozinho. O próximo passo é ter critérios de avaliação que funcionem independentemente do quanto o discurso do fornecedor seja sofisticado. As cinco dimensões abaixo formam um framework aplicável a qualquer processo de seleção.

1. O problema é horizontal ou vertical?

Antes de avaliar qualquer empresa de inteligência artificial, a pergunta correta não é "qual é a melhor plataforma de IA do mercado?" É: "o problema que preciso resolver é transversal à organização ou específico de uma indústria e função regulada?"

Operações de cobrança, serviço ao cliente em serviços financeiros, gestão de recebíveis são problemas verticais. Criação de conteúdo, resumo de documentos e assistência interna são problemas horizontais. A resposta a essa pergunta determina em qual camada do mercado você deve estar olhando.

2. O sistema acumula memória ou recomeça do zero a cada interação?

Esta é, possivelmente, a distinção mais importante entre automação e inteligência composta.

Um agente sem memória persistente pode automatizar volume, mas não aprende. Cada conversa começa do zero, sem contexto de interações anteriores, sem histórico de compromissos e sem rastreamento de razões para inadimplência ou insatisfação. A diferença entre uma operação com 30% de recuperação e uma com 60% frequentemente está aqui, não na tecnologia de linguagem em si.

3. O fornecedor oferece execução determinística onde a regulação exige?

Modelos de linguagem são probabilísticos por natureza. Em processos regulados, isso cria risco. O que importa avaliar não é se o fornecedor usa LLM: é se existe uma camada de governança que garante que decisões críticas sejam executadas de forma determinística, auditável e alinhada com políticas internas e exigências regulatórias como LGPD, CDC e normas do Banco Central.

4. Quais são as capacidades de orquestração?

Um agente único é suficiente para tarefas isoladas. Operações empresariais complexas, como uma jornada que começa em atendimento, passa por contas a receber e chega à cobrança, exigem sistemas multiagente com coordenação entre especialistas em diferentes estágios do fluxo.

Avalie se a arquitetura do fornecedor foi construída para orquestração desde o início ou se é um agente único com features adicionadas posteriormente.

5. Como o fornecedor explica o que o agente decidiu?

Observabilidade em produção não é detalhe técnico. É a diferença entre um projeto que escala e um que é cancelado após o piloto.

Exija rastreabilidade de decisões, capacidade de auditoria por conversa e relatórios de performance que permitam identificar onde o agente falhou e por quê. Sem isso, qualquer problema em produção se torna uma caixa-preta impossível de diagnosticar.

Não sabe onde sua operação está hoje? Use a Calculadora de ROI da Moveo.AI para dimensionar o impacto financeiro de uma implementação de agentes de IA com memória nas suas operações de Customer-to-Cash.

O erro mais frequente na avaliação: comparar fornecedores de camadas diferentes

A maioria dos processos de RFP que fracassam comete o mesmo equívoco: colocam na mesma tabela comparativa empresas que operam em camadas completamente distintas do mercado.

Um modelo de fundação, uma plataforma horizontal e um especialista vertical não são concorrentes diretos. Estão resolvendo problemas diferentes em partes diferentes da pilha.

O resultado prático desse erro é que os critérios de avaliação ficam ou genéricos demais, como qualidade de linguagem, tempo de resposta e facilidade de uso, ou tecnicamente deslocados em relação ao problema de negócio em questão.

Nenhuma plataforma horizontal vai ser reprovada em um benchmark de conversação geral. O problema é que benchmarks de conversação geral não predizem performance em cobrança regulada, gestão de recebíveis ou atendimento de sinistros.

Por que especialistas verticais constroem vantagem estrutural com o tempo

Plataformas horizontais têm flexibilidade. Especialistas verticais têm profundidade, e essa profundidade compõe ao longo do tempo. Cada interação alimenta o sistema de decisão para a próxima, sem intervenção humana entre os ciclos. É o que a Moveo.AI chama de Compounding Intelligence: a operação se torna mais precisa, mais eficiente e mais personalizada quanto mais tempo opera.

Esse padrão é consistente com o que pesquisadores da Trullion identificaram ao construir sua própria matriz de sobrevivência de projetos de IA: os projetos com maior probabilidade de persistir são aqueles com alta especificidade de domínio combinada com integração profunda em fluxos de trabalho.

Não é coincidência que essa seja exatamente a descrição de um especialista vertical bem implementado.

Para entender por que a arquitetura subjacente importa tanto quanto a especialização de domínio, vale ler o artigo Por que LLMs generalistas falham em operações estruturadas.

Três perguntas para antes de entrar em qualquer processo de seleção de IA

Muitos projetos são condenados antes da primeira reunião com fornecedores, porque a empresa ainda não respondeu às perguntas básicas sobre o que precisa.

Antes de iniciar qualquer avaliação formal de empresas de inteligência artificial, vale garantir que essas três questões estão respondidas com clareza.

A primeira: o problema que queremos resolver tem um resultado de negócio mensurável e dono interno claro? Projetos sem KPI explícito e sem um responsável que responde pelos números são os primeiros a ser cancelados quando os custos sobem ou os resultados demoram.

A segunda: temos dados e integrações em condições de sustentar um agente em produção? A maioria das falhas de implementação não está no modelo de IA. Está nos dados fragmentados, nos sistemas legados desconectados e na ausência de uma camada de governança que controle o que o agente pode e não pode fazer.

A terceira: estamos avaliando um fornecedor para a camada certa do nosso problema? Se a resposta não é imediata, a pauta merece mais tempo antes de avançar para demos e propostas comerciais.

O mercado de empresas de IA vai continuar crescendo e se fragmentando. A capacidade de navegar esse mercado com critérios claros, e de resistir à pressão de fornecedores que transformam complexidade em hype, é o que vai separar as empresas que escalam IA das que acumulam pilotos cancelados.

Quer entender como uma arquitetura de IA com memória e governança pode transformar sua operação de Customer-to-Cash? Agende uma conversa com nosso time.