Por Que a Maioria das Decisões de Produto São Construídas em Areia
Você lançou uma feature. O time todo acreditava que ela resolveria um problema central. Mas as métricas de uso estagnam. Os tickets de suporte disparam. O gerente de produto suspira. Parece familiar?
A verdade dura: a maioria dos times opera em palpites disfarçados de dados. Pesquisas, anotações de CRM e até entrevistas diretas com usuários podem ser terrivelmente enganosas. Como Erika Hall escreveu, fazer uma pergunta diretamente é a pior maneira de obter uma resposta verdadeira e útil.
Para construir produtos que realmente funcionam, precisamos ir além do feedback superficial e entender os usuários em quatro níveis distintos: o que eles falam, o que pensam e sentem, o que fazem e por que fazem. Esse framework, originalmente articulado por Hannah Shamji, é uma lente poderosa para qualquer dev ou time de produto.
Vamos detalhar cada nível com técnicas concretas que você pode aplicar amanhã mesmo.

Os Quatro Níveis: Do Ruído ao Sinal
Nível 1: O Que Eles Falam (O Mais Não Confiável)
Esse é o dado mais fácil de coletar — e o mais perigoso de confiar. As pessoas exageram, focam em casos extremos e racionalizam seu comportamento depois do fato. Um usuário dizer "eu preciso absolutamente de uma tabela de comparação" não significa que ele não consiga atingir seu objetivo sem ela.
O que fazer: Use pesquisas e dados de CRM apenas como ponto de partida, nunca como tomador de decisão. Trate cada necessidade declarada como uma hipótese a ser testada.
Nível 2: O Que Eles Pensam e Sentem (Contexto, Mas Ainda Tendência)
Entrevistas e estudos de diário fornecem um contexto mais rico, mas a memória é um filtro defeituoso. Os usuários reconstroem sua experiência através das lentes de como querem ser percebidos.
Técnica prática: Use a Roda das Emoções de Geoffrey Roberts durante as entrevistas. Em vez de perguntar "Como você se sentiu?", apresente a roda e peça para o usuário apontar. Isso move a conversa além de "bom" ou "ruim" para emoções precisas como "frustrado" ou "curioso".
Nível 3: O Que Eles Fazem (O Padrão Ouro)
Dados comportamentais — cliques, scrolls, hovers, tempo na tarefa — não mentem. Mas análises brutas podem ser enganosas sem contexto.
Técnica prática: Faça sessões de análise de tarefa. Observe usuários completando um fluxo de trabalho central sem pedir que falem em voz alta. O protocolo "falar em voz alta" na verdade interrompe o comportamento natural. Em vez disso, observe onde o mouse passa sem clicar, onde os usuários rolam para frente e para trás, e quanto tempo pausam. Só faça perguntas depois que eles sinalizarem que terminaram ou estão travados.
# Script simples de análise de gravação de sessão (conceitual)
# Rastrear pontos de hesitação em uma sessão de usuário
import pandas as pd
# Suponha que temos um CSV com eventos de mouse
session_data = pd.read_csv('sessao_usuario_001.csv')
# Filtrar eventos hover com duração maior que 3 segundos (hesitação)
hesitacoes = session_data[
(session_data['tipo_evento'] == 'hover') &
(session_data['duracao_ms'] > 3000)
]
# Agrupar por elemento de UI e contar
pontos_dor = hesitacoes.groupby('id_elemento').size().sort_values(ascending=False)
print("Principais pontos de hesitação:")
print(pontos_dor.head())
Nível 4: Por Que Eles Fazem (O Insight Mais Profundo)
Esse nível descobre motivações subjacentes, objetivos e causas raiz. Requer conversas repetidas baseadas em confiança e observação real do fluxo de trabalho.
Técnica prática: Use "espelhamento" — repita o que o usuário disse, ou faça a mesma pergunta parafraseada. Isso geralmente desencadeia uma segunda resposta mais honesta com contexto mais rico.
Triangulação: Reconciliando Dados Conflitantes
Níveis diferentes frequentemente vão se contradizer. Um usuário diz que quer X (Nível 1), mas seu comportamento mostra que ele realmente usa Y (Nível 3). Isso não é um problema — é o sinal. Triangule combinando métodos: pesquisa + análise + observação + entrevista.
Para leitura mais aprofundada sobre métodos de pesquisa de usuário, confira este guia prático sobre descoberta de necessidades do usuário — ele cobre horas de exposição, testes de UX ao vivo e insights de helpdesk.

Armadilhas Comuns e Limitações
- Dependência excessiva de NPS: NPS mede sentimento, não comportamento. É uma métrica de vaidade. Foque na taxa de sucesso da tarefa e no tempo na tarefa.
- Viés de confirmação em testes de usuário: Muitos times "validam" suposições existentes em vez de explorar genuinamente. Vá com perguntas, não com respostas.
- Emoções como distração: Alin Buda argumenta que nosso trabalho é resolver problemas, não performar empatia. Use sinais emocionais como ferramenta de diagnóstico, não como objetivo final.
Próximos Passos: Crie um Hábito de Pesquisa
- Horas de exposição: Cada membro do time deve passar 2 horas a cada 6–8 semanas observando usuários reais.
- Teste de UX ao vivo: Convide toda a empresa para observar as sessões. Torne as dificuldades dos usuários visíveis.
- Sessões de co-design: Mostre protótipos aos usuários e peça para ranquearem funcionalidades. As prioridades deles vão te surpreender.
Para um mergulho mais profundo em como IA e fluxos de trabalho agênticos estão mudando o desenvolvimento de produto, veja esta análise sobre muitos agentes, um time.

Conclusão
O verdadeiro entendimento do usuário não vem de ferramentas caras ou grandes amostras. Vem de uma prática disciplinada de observar, diagnosticar e construir confiança. Pare de validar. Comece a pesquisar.
Uma ação para esta semana: Agende uma sessão de 30 minutos para assistir um usuário completar sua funcionalidade principal. Não faça perguntas. Apenas observe. Depois se pergunte: o que aprendi que nenhuma pesquisa poderia ter me contado?