À medida que os LLMs começam a projetar automaticamente interações com o cliente em múltiplos passos (e-mails, chats, notificações), surge uma pergunta fundamental: 'Como sabemos se essa jornada gerada por IA é realmente eficaz?' As métricas tradicionais de avaliação — precisão, similaridade e até mesmo LLM-as-a-Judge — frequentemente avaliam estilo ou tom, mas falham em capturar a lógica estrutural da jornada e seu alinhamento com os objetivos de negócio. Este artigo apresenta o framework CDP, um conjunto de métricas determinísticas que medem a qualidade da jornada com base em uma taxonomia pré-definida. Você pode explorar os conceitos fundamentais no material de origem.

AI and machine learning concept with abstract data visualization

Os Três Pilares das Métricas CDP

O CDP avalia a qualidade da jornada em três dimensões complementares:

  1. Continuidade (C)

    • O que mede: Se cada mensagem se encaixa no contexto estabelecido pelas interações anteriores. Verifica transições temáticas suaves, sem saltos abruptos.
    • Como é calculada: Atribui pesos aos padrões de transição dentro da árvore taxonômica (ex.: mesmo tópico, tópico relacionado, avanço de estágio, retrocesso) e calcula a média dos escores por passo.
  2. Aprofundamento (D)

    • O que mede: Se a jornada se move de conteúdo geral para interações mais específicas, detalhadas ou personalizadas, aprofundando assim o relacionamento.
    • Como é calculada: Uma combinação ponderada de dois componentes:
      • Aprofundamento Baseado na Jornada: Mede o aumento no nível de profundidade dentro da árvore taxonômica de um passo para o próximo.
      • Aprofundamento Consciente da Taxonomia: Calcula a proporção de itens de conteúdo mais profundos possíveis (sob os tópicos visitados) que são realmente explorados durante a jornada.
  3. Progressão (P)

    • O que mede: O movimento direcional e o ritmo através dos estágios definidos da jornada do cliente (ex.: Conscientização -> Compra -> Posse), detectando retrocessos desnecessários ou estagnação.
    • Como é calculada: Os escores são somados com base nas transições de estágio (diferença de ID da âncora) e na importância relativa do estágio atual, e então normalizados para uma faixa [-1, 1] usando uma função tanh.

Data flow and structural analysis diagram on a screen

Exemplo Aplicado: Uma Jornada de Compra Automotiva

Vamos percorrer um exemplo simplificado para ver a avaliação CDP em ação. 🚗

Jornada de Entrada (sequência de mensagens gerada por LLM):

  1. Faça um tour virtual para descobrir os principais recursos e acabamentos.
  2. Encontramos um horário para um test drive que se encaixa na sua agenda.
  3. Faça upload da sua comprovação de renda e documento de identidade para finalizar a decisão de pré-aprovação.
  4. Estime os custos para os próximos itens de manutenção.
  5. Acompanhe ofertas de retenção conforme o fim da sua locação se aproxima.
  6. Adicione placas e informações de registro antes da entrega.

Resultado do Mapeamento Taxonômico: Cada mensagem é mapeada para um nó específico na árvore taxonômica (âncora, tópico principal, nível de profundidade) com base na similaridade de embeddings. Os escores CDP são computados analisando as transições entre os passos.

Interpretando os Sinais CDP para Esta Jornada:

  • Continuidade: Em sua maioria suave, embora a pontuação possa cair onde os estágios se misturam.
  • Aprofundamento: Captura momentos de mergulho mais profundo em um tópico, como a transição de 'agendar um test drive' para 'fazer upload de documentos para pré-aprovação'.
  • Progressão: Mostra um movimento geral para frente em direção à compra, mas também revela uma regressão estrutural, como uma tarefa inesperada de 'entrega' aparecendo durante o estágio de posse.

Esses escores CDP calculados podem ser usados diretamente para comparar jornadas alternativas geradas por diferentes prompts ou modelos, ou para fornecer feedback automatizado para melhorar continuamente a geração de jornadas baseada em LLM.

Server rack and cloud infrastructure representing system architecture

Conclusão: Por que a Estrutura Importa

Os LLMs já são capazes de gerar texto fluente e persuasivo. O maior desafio agora é garantir que essas sequências de texto formem narrativas coerentes que se alinhem com a lógica de negócios e a experiência do usuário. O framework CDP não substitui a avaliação estilística; ele a complementa fornecendo um novo sinal primário: a estrutura.

Essa abordagem não se limita ao comércio automotivo. Qualquer sistema que gere conteúdo ordenado e orientado a objetivos — seja design de cursos educacionais, caminhos de consulta em saúde ou linhas de missão em jogos — requer uma base estrutural sólida. O CDP oferece uma maneira de tornar essa estrutura explícita, mensurável e acionável. Da próxima vez que você avaliar uma sequência gerada por IA, pergunte não apenas 'A linguagem é natural?', mas 'A estrutura é sólida?' 💡