Toda ferramenta de vibe coding vende a mesma ilusão: a de que o custo de um app é o custo de gerá-lo. O primeiro prompt é barato e espetacular. O orçamento morre mais tarde, no loop de correção, e o loop de correção não é um caso isolado. É o modo de operação normal de toda ferramenta de geração de código deste site assim que um app ultrapassa um tamanho trivial.
Por que o 20º prompt custa mais que o 1º
O primeiro prompt escreve em uma tela em branco; o modelo é bom nisso, e uma única rodada geralmente traz um progresso visível. Já o 20º prompt precisa modificar um sistema existente que o modelo lembra apenas parcialmente. À medida que as bases de código crescem, elas excedem o contexto de trabalho da IA, e o modelo começa a contradizer suas próprias decisões anteriores. As correções atacam os sintomas em vez das causas raiz, então um ajuste em um lugar quebra outro - o que os desenvolvedores chamam de efeito whack-a-mole. A iteração também infla o próprio artefato: a limitação de contexto faz com que a IA reescreva funções utilitárias que ela não consegue ‘enxergar’, deixando lógicas duplicadas e uma colcha de retalhos de estilos que torna cada correção subsequente mais difícil de implementar.
Assim, a economia unitária se inverte. Os primeiros prompts compram funcionalidades; os prompts tardios compram tentativas. E cada tentativa é cobrada.
O que dizem os medidores
Dados de pesquisa por ferramenta, todos baseados em relatos documentados de usuários.
O Lovable vende créditos; o plano Pro base custa 25 euros por 100 créditos mensais. Usuários relatam que o consumo por prompt subiu de cerca de 1,2 para 3 ou 4 créditos - uma inflação de custos de quase dez vezes ao longo do tempo, com até mesmo perguntas sobre o código consumindo frações de crédito. Analistas descrevem o ciclo canônico: créditos gastos em chats de depuração onde o agente introduz novos erros ao resolver o primeiro, com relatos de a IA afirmar que corrigiu algo quando, na verdade, não corrigiu. A 3 ou 4 créditos por prompt, um mês de 100 créditos rende menos de 30 tentativas.
O Bolt vende tokens, com 10 milhões no nível Pro de US$ 25. A reclamação principal é pagar por falta de progresso: o edit-diff que é imediatamente reescrito sem a alteração, “apenas queimando tokens sem mudanças”, e limites mensais consumidos por um erro gerado, deixando o desenvolvedor esperando o próximo mês para corrigir o erro da própria ferramenta. Usuários também descrevem um esgotamento opaco durante loops complexos, sem detalhamento de quais edições consumiram os tokens.
O Replit tem a curva mais acentuada porque seu preço é baseado no esforço: a fatura acompanha o quão duro o agente trabalha, e nada faz um agente trabalhar mais do que depurar a si mesmo. Casos documentados: US$ 25 em créditos gastos em menos de um dia, US$ 350 em um único dia, US$ 700 em um mês e US$ 1.500 em cobranças surpresa de banco de dados, impulsionadas em parte por backups por checkpoint. A leitura mais pessimista da comunidade é estrutural: mais erros significam mais correções, que significam mais execuções cobradas.
Medidores diferentes, mesmo padrão. A unidade de preço é a tentativa, e a depuração é a atividade que maximiza as tentativas.
Nomeando a taxa
Chamemos isso de taxa do loop de correção (fix loop tax): a diferença entre o que você pagaria se a geração funcionasse de primeira e o que você realmente paga. Ela possui três propriedades relevantes. É invisível no momento da compra, já que o preço de tabela descreve o “cenário ideal”. É regressiva, atingindo com mais força os desenvolvedores menos capazes de diagnosticar causas raiz, pois eles realizam mais rodadas de prompts. E está correlacionada à importância: os apps que geram os loops mais profundos são justamente os apps de negócios ricos em casos de borda e autenticação complexa, aqueles que você mais precisa que funcionem, como os analisados em Lovable vs Bolt.
Essa taxa também não fica restrita à coluna de custos. Cada rodada cobrada em uma funcionalidade de autenticação é como jogar novamente os dados da segurança, conforme discutido em o que ‘45% do código de IA é vulnerável’ realmente significa, e o próprio loop é a face cotidiana do problema do Dia Dois: a fase de manutenção onde cada mudança corre o risco de quebrar a anterior. O medidor é apenas a parte que você consegue ver na fatura.
Pagando menos, ou nada
Em ferramentas de geração de código, as mitigações dependem de técnica: delimite os prompts de forma estreita, faça commit de cada estado funcional, leia os diffs antes de aceitar e reconheça o desvio (drift) cedo o suficiente para parar. Uma ferramenta de assinatura fixa como o Cursor, ao menos, limita o pior cenário a um valor mensal conhecido.
A resposta estrutural é notar quais apps não precisam de um loop. Um portal ou ferramenta interna é, em grande parte, autenticação, permissões e CRUD; em uma plataforma como o Softr, isso é configuração: você altera uma configuração, a mudança é feita, sem rodada de regeneração e sem tentativa cobrada. O Softr possui créditos de IA para seu Co-Builder, mas como tudo o que a IA faz também pode ser feito manualmente, um saldo zerado nunca bloqueia uma correção. Para apps de negócios, o loop de correção mais barato é aquele que não existe.