As 4 Dimensões de um Bom Prompt (A Maioria Só Pensa em 1)
Um bom prompt tem 4 dimensões: Clareza (intenção sem ambiguidade), Estrutura (papel + tarefa + formato), Contexto (informações que mudam a interpretação) e Especificação de Output (formato, comprimento e restrições exatos). A maioria das pessoas só otimiza clareza — ignorar as outras três é o motivo pelo qual prompts que parecem bons ainda falham em produção.
A maioria dos conselhos de prompt engineering foca em uma coisa: as palavras certas. "Seja específico." "Use linguagem clara." "Adicione exemplos." Esse conselho não está errado — mas está incompleto. Redação é apenas uma dimensão de um prompt.
Ao analisar o que realmente quebra prompts em produção, há quatro dimensões estruturais que determinam se um prompt funciona de forma confiável — e a maioria dos guias fala sobre apenas uma delas. Otimizar só a redação e ignorar as outras é por que prompts que "parecem bons" ainda falham.
Dimensão 1: Clareza
Clareza é a dimensão que todos mencionam, mas a maioria entende errado. Clareza não é ser agradável e legível — é não deixar espaço para interpretação equivocada.
Um prompt é claro quando há exatamente uma interpretação razoável do que você está pedindo. Se uma pessoa competente pudesse ler seu prompt e imaginar dois outputs corretos diferentes, o prompt não tem clareza.
Falhas comuns de clareza:
- Usar termos relativos sem âncoras ("seja conciso" vs "em até 80 palavras")
- Suposições implícitas ("escreva um resumo" — de que tamanho, para qual audiência, em que formato?)
- Escopo ambíguo ("analise estes dados" — quais aspectos? qual output?)
Como testar: Leia seu prompt como se nunca tivesse visto o material de origem. Você saberia exatamente o que produzir?
Dimensão 2: Estrutura
Estrutura é sobre como o prompt é organizado — e importa mais do que a maioria percebe. LLMs processam prompts sequencialmente e ponderam conteúdo anterior de forma mais pesada em algumas configurações. Um prompt mal estruturado pode fazer o modelo despriorizar restrições críticas.
Boa estrutura significa:
- Papel e contexto vêm primeiro
- A tarefa principal é declarada claramente antes de restrições ou casos extremos
- O formato de output é especificado no final, próximo de onde o modelo vai começar a gerar
- Instruções de nível de sistema são separadas do input por requisição
A falha estrutural mais comum é enterrar a instrução mais importante no meio de um parágrafo longo. O modelo a vê, mas não a pondera como você pretendia.
Dimensão 3: Contexto
Contexto é a informação de que o modelo precisa para tomar boas decisões — e quase sempre é subespecificado. Não porque as pessoas não sabem, mas porque é tão óbvio para elas que esquecem que o modelo não compartilha seu background.
Falhas de contexto se parecem com:
- Definição de audiência ausente ("explique isso" — para quem? com que background?)
- Propósito ausente ("escreva uma descrição de produto" — para uma landing page? para uma listagem? para um doc interno?)
- Restrições que o autor considera óbvias ("sem jargões" — mas você sabe o que conta como jargão, o modelo não sabe)
Um exercício útil: imagine que você está integrando um novo funcionário brilhante para essa tarefa. O que você diria a ele antes de começar? Esse é o seu contexto faltante.
Dimensão 4: Especificação de Output
Spec de output é a dimensão mais subutilizada. A maioria dos prompts descreve a tarefa mas não o output. Isso força o modelo a decidir formato, comprimento, estrutura e tom — e ele vai decidir diferente cada vez.
Specs de output fortes incluem:
- Formato (JSON, markdown, prosa, lista numerada)
- Restrições de comprimento (contagem exata de palavras, número de itens, máximo de caracteres)
- Tom (formal, casual, técnico, conversacional)
- O que excluir ("não inclua cabeçalhos", "evite bullets")
Quanto mais precisamente você especifica o output, mais reproduzíveis os resultados. Isso é especialmente importante para prompts rodando em produção — você precisa conseguir fazer parse e depender do output downstream.
Por que todas as quatro importam juntas
Essa também é a causa raiz da maioria das inconsistências em prompts — quando uma dimensão está fraca, o modelo preenche a lacuna de forma diferente cada vez. Se você tem tido outputs imprevisíveis, essa análise explica exatamente o porquê.
Um prompt pode se sair bem em três dimensões e ainda falhar se uma está fraca. Um prompt lindamente estruturado e rico em contexto com um spec de output vago ainda produzirá resultados inconsistentes. Um prompt cristalino com spec de output forte mas contexto ausente produzirá resultados consistentemente errados.
As quatro dimensões interagem. Melhorar uma frequentemente revela lacunas em outra. É por isso que avaliar prompts de forma holística — não apenas "isso soa bem" — é a única forma confiável de saber se um prompt está pronto para produção.
Depois de entender as quatro dimensões, o próximo passo lógico é construir um processo de avaliação repetível antes de publicar. Este guia cobre exatamente isso.
No PromptEval, pontuamos prompts em todas as quatro dimensões e mostramos exatamente qual está puxando seu score para baixo. Leva cerca de 10 segundos e te diz mais do que ler o prompt você mesmo.
O checklist
Antes de publicar qualquer prompt, verifique cada dimensão:
- Clareza: Há apenas uma interpretação razoável?
- Estrutura: A instrução mais importante está na posição certa?
- Contexto: O modelo tem tudo que uma pessoa inteligente precisaria?
- Spec de output: O formato de output desejado está explicitamente definido?
Quatro perguntas. Esse é o framework completo.
Score your prompts before they hit production
PromptEval scores prompts 0–100 across 4 dimensions — clarity, structure, context, and output spec — and tells you exactly what to fix.
Try free →