Arquitetura Híbrida Moveo.AI: Um “Deep Dive” [Capítulo 7, AI Deep Dives Series]

George

Chief of AI na Moveo

September 29, 2025

in

✨ AI Deep Dives

Em ambientes de alto risco, como pagamentos e contas a receber (AR), ser "impressionante" não é suficiente: o padrão é ser previsível e auditável. Os capítulos 3 a 6 mostraram por que mega-prompts únicos ou as "caixas-pretas" de tool-calling podem pular etapas, desordenar ações ou ter o comportamento alterado por pequenas mudanças na redação.

O Capítulo 7 explica como a arquitetura da Moveo torna a automação por IA segura: fluxos determinísticos para controle e agentes especializados para inteligência.

Mostraremos por que nosso sistema híbrido, que combina o poder de LLMs ajustados (fine-tuned) para tarefas específicas com a estrutura rígida de fluxos de diálogo determinísticos, é a resposta para construir um Agente de IA que não é apenas inteligente, mas também seguro, previsível, controlável e totalmente auditável.

Mais do que um simples "wrapper": o porder dos Agentes Especializados

Mais do que um simples "wrapper": o porder dos Agentes Especializados

Ter um único modelo fazendo "tudo" parece simples, mas dificulta o controle, os testes e o gerenciamento de mudanças. A Moveo decompõe o trabalho em quatro agentes especializados, cada um ajustado (fine-tuned) para sua subtarefa, garantindo que o comportamento seja mensurável e passível de melhoria contínua:

  • Agente de Planejamento: Responsável por entender a intenção do usuário e selecionar o fluxo de trabalho, os documentos ou as ferramentas de suporte corretas. O resultado deste Agente é uma taxa muito maior de planos "acertados na primeira vez" e uma redução significativa em erros custosos.

  • Agente de Resposta: Conduz a conversa em si. Foca em clareza, empatia e completude, ao mesmo tempo que coleta os parâmetros necessários do usuário. O resultado é a melhoria na satisfação do cliente, maior containment e jornadas end-to-end mais bem-sucedidas, sem desvios de política.

  • Agente de Conformidade Pós-Resposta (Post-Response Compliance): Atua como uma salvaguarda antes que qualquer mensagem seja entregue ao cliente. Ele verifica se o tom e a linguagem são apropriados e se todas as divulgações ou isenções de responsabilidade exigidas estão presentes. O resultado é uma redução drástica nas violações e uma taxa quase zero de declarações proibidas ou arriscadas chegando aos clientes.

  • Agente de Insights: Analisa a conversa após sua conclusão. Extrai dados estruturados, como se o usuário prometeu pagar, expressou dificuldades ou sinalizou uma ameaça legal. O resultado são sinais operacionais mais claros que podem ser usados para acionar as ações de follow-up corretas e alimentar a análise para melhoria contínua.

Essa divisão de tarefas não é acidental. Ela nos permite usar modelos de linguagem como Gemma, GPT-OSS e Llama, especificamente ajustados (fine-tuned) para cada subtarefa.

Em nossos benchmarks, a especialização proporcionou melhorias de impacto que são críticas para o uso corporativo:

  • O Agente de Planejamento melhorou a qualidade e a adesão ao plano em mais de 15%, garantindo que os clientes sejam consistentemente direcionados aos workflows corretos.

  • O Agente de Resposta reduziu as alucinações em 4% e elevou as respostas corretas de "não sei" em 10%. Essa capacidade de admitir incerteza, em vez de inventar uma resposta, é extremamente importante em ambientes regulamentados, onde uma única declaração fabricada pode gerar reclamações ou escrutínio regulatório.

  • O Agente de Conformidade Pós-Resposta aumentou a detecção de tentativas de prompt jailbreak em 30%, fechando uma grande lacuna de segurança que modelos genéricos rotineiramente ignoram.

Esses avanços, impulsionados por Supervised Fine-Tuning (SFT) e Reinforcement Learning (RL) direcionados, não são ganhos marginais. São melhorias decisivas que separam a IA experimental da IA de nível empresarial.

‭→ Leia o capítulo 3: O Problema com o "Prompt & Pray"

Fluxos de Diálogo Determinísticos = Seu Painel de Controle

Se os agentes especializados, alimentados por LLMs, são o motor, os fluxos de diálogo são o painel de controle (control plane). Eles representam a parte determinística e auditável da nossa arquitetura.

Em vez de permitir que o LLM decida a ordem e a lógica do negócio, usamos fluxos visuais que você pode construir facilmente com uma interface drag-and-drop.

Os fluxos de diálogo são workflows versionados que controlam a ordem, as permissões e os efeitos colaterais. Os LLMs ajudam na compreensão e na extração de parâmetros, mas os fluxos garantem:

Sequenciamento Obrigatório (Enforced Sequencing

Todo passo importante ocorre na ordem certa. Por exemplo, um fluxo pode forçar a sequência de Consentimento → Verificação OTP → Escrita da Transação. Sem essa obrigatoriedade, um modelo poderia criar um plano de pagamento antes do consentimento ou pular a autenticação, o que é inaceitável em ambientes regulamentados.

Controle de Risco com Escopos e Perfis (Roles

Ações arriscadas ou de alto impacto são explicitamente barradas (gated) para que não possam ser acionadas por acidente ou uso indevido. Um reembolso, a abertura de uma disputa ou a criação de um novo plano de pagamento só está disponível se o fluxo conceder acesso com base no escopo ou perfil. 

Isso significa que a IA nunca pode evoluir de "responder a uma consulta de saldo" para "iniciar um reembolso" sem a devida autorização.

Verificações de Argumentos Válidos para o Negócio (Business-Valid

Modelos podem frequentemente produzir dados que parecem válidos na superfície, mas falham em regras críticas de negócio. A validade do schema não é a mesma que a validade para o negócio.

Por exemplo, um modelo pode propor uma data de início para um plano de pagamento que cai em um fim de semana ou selecionar uma periodicidade de pagamento que entra em conflito com a política. O fluxo valida esses argumentos contra as regras corporativas antes de permitir qualquer escrita, prevenindo problemas de conciliação (reconciliation) e compliance.

Retries, Rollbacks e Idempotência 

Os processos empresariais não podem tolerar falhas silenciosas ou transações duplicadas. Os fluxos gerenciam retries (tentativas) quando APIs falham, roll back (revertem) com segurança se uma etapa for interrompida e garantem a idempotência, para que cada ação do cliente seja executada uma vez e apenas uma vez. Isso elimina o caos de conciliação e fortalece a resiliência operacional.

Full Observability e Auditoria 

Cada etapa, decisão, parâmetro e resultado são registrados de forma que possam ser reproduzidos para auditores ou reguladores. Os líderes podem ver exatamente o que aconteceu, por que aconteceu e quais guardrails foram aplicados. Isso fornece o nível de prestação de contas e rastreabilidade que as empresas exigem.

Exemplo – "Configurar um plano de pagamento"

Prompt and Pray: O modelo cria um plano diretamente após um chat persuasivo. OTP/autenticação/consentimento podem ser pulados ou fora de ordem.

Fluxo Moveo: O fluxo exige consentimento explícito (Sim/Não) → envia e verifica OTP (baseado em regras) → cria o plano somente após a verificação → registra a divulgação + parâmetros do plano na trilha de auditoria.

Impacto no Negócio: Nenhuma criação de plano não verificada; conciliação mais limpa; artefatos prontos para auditores.

Governança e Segurança inerentes (Guardrails by Design)

Nossa arquitetura foi projetada com segurança e governança em mente, o que chamamos de "Guardrails by Design". O sistema inclui:

  • Validadores (Validators) garantem que cada ID de transação, valor ou parâmetro de plano seja verificado antes e depois da execução. Isso evita o equivalente digital de enviar dinheiro para a conta errada, o que em pagamentos significa exposição a chargebacks e caos na conciliação.

  • Portões de Consentimento (Consent Gates) exigem um Sim ou Não claro antes de ações sensíveis. Assim como um banco não movimenta dinheiro sem autorização, nossos fluxos não criarão um plano ou disputa sem consentimento provável, protegendo contra disputas de LGPD e reclamações de clientes.

  • Observability fornece aos líderes um registro (log) reproduzível de cada etapa, da mesma forma que as caixas pretas registram os dados de voo. Quando reguladores ou equipes de risco perguntam o que aconteceu, você tem uma resposta definitiva.

  • Controle de Tom e Conformidade garante que a linguagem nunca cruze a linha para a coerção. Em cobranças, essa é a diferença entre um lembrete profissional e uma violação do CDC (Código de Defesa do Consumidor).

Para as empresas, a mensagem é simples: guardrails transformam a IA de uma demo promissora em um sistema no qual você pode realmente confiar em casos de uso de alto risco, como pagamentos e contas a receber. Sem eles, você está esperando que o piloto automático acerte. Com eles, você está voando com pilotos treinados, controle de tráfego aéreo e gravadores de caixa-preta instalados. Essa é a diferença entre experimentação e IA de nível empresarial.

A vantagem Moveo.AI: uma comparação clara

Para tornar nossa abordagem ainda mais clara, vamos compará-la diretamente com sistemas baseados puramente em LLMs:

Área

Pure LLM “Prompt & Pray” (ou “Tools & Pray”)

Híbrido: LLMs Especializados + Fluxos Determinísticos (Moveo)

Painel de Controle

A lógica de negócio está enterrada em prompts/descrições de ferramentas; o comportamento é emergente

Fluxos de diálogo versionados definem ordem e efeitos colaterais explicitamente; a lógica de negócio é definida em flows drag-and-drop

Uso de RAG

Wrapper superficial: documentos recuperados inseridos em um mega-prompt

Recuperação direcionada + seleção de plano; o Agente de Planejamento decide o que é usado e quando

Function calling

O modelo decide se/quando/como chamar ferramentas (sem garantias)

Ferramentas usadas dentro dos fluxos; as chamadas são ordenadas e validadas pelo fluxo

Orquestração de Workflow

Encaminhamento de prompts implícito e frágil

Orquestração explícita com retries, branching, rollback e idempotência

Consentimento e Autenticação

No prompt = sem garantia (pode ser pulado)

Portões rígidos (Consentimento Sim/Não) e verificações de autenticação obrigatórias antes de qualquer escrita

Compliance & Tom

Instruções de melhor esforço; fácil de desviar sob pressão; suscetível a jailbreaks

O Agente de Conformidade Pós-Resposta verifica tom, reivindicações e aderência à política

Observabilidade e Auditoria

Logs fragmentados de ferramentas; difícil de reconstruir decisões

Telemetria em nível de etapa e trilha de auditoria completa em todos os agentes e passos do fluxo

Manutenção

Proliferação de prompts/funções; edições arriscadas

Mudanças config-first (fluxos, políticas), pequenos fine-tunes por agente

Foco em Performance

Um modelo tenta fazer tudo

LLMs especializados por subtarefa (ex: planejamento) → +15% de ganho na qualidade do plano

Latência e Custo

Contextos longos, chamadas de ferramentas por tentativa e erro; uso imprevisível de tokens

Prompts enxutos, ferramentas limitadas por etapa; menos retries via determinismo

Onde se encaixa

Q&A de baixo risco, utilidades leves

Jornadas de alto risco (disputas, planos de pagamento, KYC, cobranças, etc.)

A principal conclusão é: em domínios regulamentados e de alto risco, como finanças, confiar em wrappers ou chamadas de ferramentas não controladas não pode garantir a ordem do processo, compliance ou auditabilidade. 

Nossa arquitetura híbrida com agentes especializados e fluxos de diálogo oferece a experiência fluida e humana que os usuários esperam, ao mesmo tempo que entrega a governança, a segurança e a confiabilidade que as empresas exigem.

‭→ Leia o capítulo 1: O que é RAG em IA (e o que não é)

Não perca o nosso próximo capítulo "Do Smart Prompts aos Smart Systems"

Neste mergulho profundo, mostramos por que a arquitetura híbrida da Moveo.AI é a chave para alcançar a confiança e a governança em IA. Mas a jornada não termina aqui. A inteligência de um sistema não está apenas em sua capacidade de entender; está em sua capacidade de agir.

Em nosso capítulo final, "De Smart Prompts a Smart Systems", vamos concluir esta série com nossa mensagem mais importante: prompting não é produção. Exploraremos como a nossa arquitetura resolve problemas críticos que abordagens puras de LLM simplesmente não conseguem, como garantir a conformidade, validar dados e alcançar verdadeira escalabilidade.

Você está a apenas um passo de entender como a promessa da IA pode se tornar uma realidade segura e escalável para sua empresa. Fique ligado no Capítulo 8!

Fale com nossos especialistas em IA →