dos engenheiros usando codificação agentic ativamente.
claude code · 70% do código em produção · ~11% sem intervenção humana.
claude code · 2025do modelo mental à prática para times de product management e product design. fundamentos com vida útil longa, infraestrutura ai-native montada ao vivo e o time saindo com workspace, agentes e dashboard funcionando na segunda-feira seguinte.
entre 2023 e 2026, as ferramentas de ia para produto e design viraram infraestrutura operacional. não é evolução incremental, é descontinuidade. cinco evidências, três frentes.
dos engenheiros usando codificação agentic ativamente.
claude code · 70% do código em produção · ~11% sem intervenção humana.
claude code · 2025prds com qualidade comparável.
45× mais rápido com o mesmo padrão de qualidade.
state of product · 2025colaboradores em uso real.
7 a 12 horas economizadas por semana, por colaborador.
workforce report · 2025menos pessoas para chegar ao pmf entre startups que usaram ia.
97% dos fastest growers usaram ia no core do trabalho.
state of pmf · 20263 engenheiros · 32 mil linhas · 3 meses.
infra enterprise · ponta extrema · sem revisão humana.
factory.strongdm · 2026a sequência de lançamentos da anthropic em 2025 e 2026 redefiniu o que pm e product designer conseguem operar sem engenharia. claude cowork roda agentes no desktop sem código. claude design gera protótipos navegáveis com estados reais a partir de spec. live artifacts entrega dashboards conectados a apps reais. claude skills empacota playbooks como capabilities reutilizáveis. mcp conecta notion, slack e drive aos agentes em segundos.
cada um desses lançamentos é um workflow inteiro de pm ou design que antes exigia eng e que agora roda com o time de produto direto.
quem domina esses lançamentos opera prd executável, agentes de pesquisa, protótipos com dados reais e dashboards vivos sem fila de eng. o workshop é construído em cima dessa base. o time sai usando, não assistindo.
figma make, v0 e claude design geram protótipos a partir de descrição em linguagem natural.
figma mcp transforma o sistema em interface programática. agentes leem tokens reais.
não 10 entrevistas, mas 200. o ganho não é velocidade, é volume processável.
prds deixam de ser docs para ler. viram especificações que agentes processam.
live artifacts: páginas conectadas a apps reais que se atualizam sozinhas.
humano escreve spec + cenários. agentes implementam até a satisfação probabilística passar.
ferramentas de ia têm vida útil de semanas. o workshop foca em conceitos que mudam bem mais devagar e funcionam como base do método. cada fundamento vem com vocabulário, exemplo e critério de uso.
o que delegar e o que decidir.
é o eixo zero do método. de um lado, tarefas de inteligência: coleta, transcrição, sumarização, padronização, geração de variações, classificação. nelas a ia performa melhor que humano em escala. do outro, tarefas de julgamento: priorização, conflito, decisão de produto, ética, leitura de contexto político. nelas o humano é insubstituível.
não é binário. é espectro. mapear cada workflow do time nesse eixo é o exercício pré-requisito para qualquer uso produtivo de ia. sem esse mapa, o time alterna entre subutilização (medo de delegar) e uso ingênuo (delegar o que não devia).
prd, discovery e validação como specs executáveis.
spec-driven development importado de engenharia para produto. todo artefato relevante (prd, brief, hipótese, mapa de discovery) passa a ser estruturado para ser lido tanto por humano quanto por agente. anatomia universal: contexto + objetivo + restrições + cenários + critério de satisfação.
o agente passa a operar sobre o spec sem reinterpretação. o pm escreve uma vez e o artefato vira insumo para gerar telas, listas de teste, perguntas de descoberta e critério de aceite. a função do pm muda: ele para de redigir docs e começa a desenhar specs.
como agentes pedem ajuda quando travam.
nenhum agente é 100% confiável. o padrão maduro tem dois loops: o executor tenta, e quando atinge limite (ambiguidade, conflito, alta incerteza, decisão fora do escopo), aciona o advisor — humano ou outro agente especializado.
desenhar essa interface de pedido de ajuda é o que separa demo de operação. o advisor não revisa tudo, ele revisa o que importa. quem domina esse padrão consegue colocar agentes em produção sem virar refém de revisão manual.
satisfação probabilística no lugar de critério booleano.
critério de aceite "passa ou falha" não escala em ia generativa. cada execução é levemente diferente. o método maduro é cenários como holdout: lista curada de casos de teste com expectativa qualitativa, agente roda contra todos, satisfação medida em proporção (ex: 92% de cenários atingidos).
funciona como bateria de regressão para comportamento de produto. quando algo muda no agente ou no prompt, o time roda o holdout e vê o que regrediu. é o mecanismo que permite iterar com confiança, sem confiar no "achismo" de cada pessoa.
critério prático para uso produtivo, não ingênuo.
três zonas claras. delegar: baixo risco de erro × alto custo humano (transcrição, formatação, deduplicação, primeira passada de pesquisa). supervisionar: risco médio × valor de revisão alto (síntese de pesquisa, primeira versão de prd, classificação de feedback). fazer: decisão crítica × julgamento intransferível (priorização, conversa difícil, decisão sobre pessoas).
a maioria dos times alterna mal entre as três zonas. uns delegam o que precisava ser supervisionado e a qualidade cai. outros fazem o que podia ser delegado e perdem capacidade. o critério explícito muda o jogo.
linguagem comum com engenharia, liderança e fornecedores.
pm e designer que falam a língua certa (token, context window, eval, mcp, tool use, embedding, retrieval, agent loop, holdout) compram melhor, contratam melhor, decidem melhor. quem não fala vira refém de fornecedor com pitch bonito ou de engenheiro com argumento técnico opaco.
não é vocabulário de fachada. é a base para conversar com fornecedor sem virar cliente cativo, com engenharia sem quebrar telefone sem fio, com liderança sem virar tradutor de hype. cada termo vem com exemplo de uso e sinal de quando aplicar.
cada fundamento é introduzido em ciclo curto (ideia → demonstração ao vivo → prática guiada → síntese). nenhum bloco é palestra.
o time sai do workshop com sete setups configurados e funcionando, cada um com saída concreta pronta para uso. nenhum é simulação. cada participante leva o seu workspace, agente, dashboard, com fontes reais conectadas.
o workspace deixa de ser pasta com docs e vira base de dados queryable. cinco databases (projetos, hipóteses, decisões, pesquisas, agentes) com properties machine-readable, relations entre elas, claude project conectado via mcp e notebooklm para sumarização. resultado: pergunta natural ("quais hipóteses do squad x foram validadas no q1?") vira query estruturada em segundos. é a fundação sobre a qual os outros seis setups operam.
pesquisa de mercado e benchmark que durava semanas vira workflow de horas. firecrawl mcp puxa conteúdo estruturado de sites concorrentes, blogs de produto, fóruns e relatórios em escala. notebooklm consolida em base navegável com citações rastreáveis. agente faz síntese em linguagem natural sob demanda. não substitui o olhar do pm/designer, mas elimina o gargalo de coleta e padroniza a profundidade.
o prd vira spec executável. estrutura padrão (problema, hipótese, cenários, critério de satisfação, restrições) escrita uma vez e reutilizada como insumo. agente lê o prd e gera, sob demanda: rascunho de telas, lista de testes, perguntas de descoberta abertas, critérios de aceite e questões para engenharia. o pm/designer continua dono da decisão e da priorização. o agente faz o trabalho mecânico de propagar a spec por todos os artefatos derivados.
pm e designer fazem análise de dados sem depender da fila do bi. agente em background recebe pergunta em português, escreve sql, executa, gera gráfico, escreve interpretação inicial e devolve com fonte. o time mantém autonomia sobre a maioria das perguntas e libera o bi para o que é realmente estratégico ou crítico. resultado: tempo de resposta em horas, não semanas, e bi parando de ser gargalo de descoberta.
dois fluxos complementares operando juntos. (a) figma mcp expõe o design system como interface programática: tokens, componentes, estados e estilos viram dados que o agente lê e cita. (b) claude design audita telas existentes contra o sistema, sinaliza desvios com referência à regra original e sugere correção em código. resultado: o design system deixa de ser referência manual ignorada e vira lei processável que o time consulta antes de criar e o agente verifica depois de feito.
o pm/designer leva uma spec, o agente devolve um protótipo navegável com dados realistas e estados reais (loading, erro, sucesso, vazio, edge cases). não é mock estático. é validação funcional antes de envolver engenharia. permite testar com usuário, ajustar fluxo, descartar caminho ruim e decidir antes de queimar tempo de dev. o squad chega na engenharia com a hipótese já validada em comportamento, não só em ideia.
o squad sai com um dashboard que se atualiza sozinho. métricas de adoção dos novos workflows, tracker de hipóteses, status de discovery, indicadores de saúde do produto, tudo lendo do workspace queryable do setup 01. o dashboard roda em background, atualiza em ciclos curtos e fica acessível como página viva e compartilhável. fecha o ciclo: a infra construída no setup 01 vira informação acionável no setup 07.
cada bloco segue o ciclo fundamento → demonstração → prática guiada → síntese. nenhum bloco é palestra. e o time sai com dez entregáveis tangíveis para usar na segunda-feira seguinte.
sessão online de uma hora com a liderança de produto para entender contexto do time: design system, fluxos críticos, personas, métricas que importam, dores atuais e prioridades do trimestre. todo o material do workshop é calibrado nesse insumo.
cada exemplo, cada setup e cada exercício do workshop é calibrado no produto e nos workflows reais do time. o que sai do workshop é aplicável na segunda-feira porque foi construído em cima do que o time faz, não do que um material padrão sugere.
canal direto com a facilitação para destravar o time enquanto a operação ai-native ganha tração. perguntas, ajustes de config, validação de novos workflows.
ao final, cada participante tem workspace queryable, hub de pesquisa, prd executável, agente de dados, design system auditável, protótipo funcional e dashboard vivo. com fontes reais conectadas.
passo a passo visual de cada workflow.
passo a passo de configuração de cada componente.
5 databases, properties, relations, claude project com mcp.
system prompts de pm e designer, síntese, prd, auditoria, live artifact.
dashboard pessoal levado do setup 7, configurado.
como decompor workflow em specs, end-to-end, em 7 contextos.
consolidado pelos facilitadores após o workshop.
classificação inteligência × julgamento por participante.
infra python local + anthropic agents api.
duas semanas com os facilitadores após o workshop.
o workshop é a primeira camada. as outras existem como caminho coerente, não como compromisso. nenhuma delas além da primeira precisa ser decidida agora.
o time de produto opera no padrão executor + advisor com sdd, infraestrutura configurada e ferramentas integradas. cada pm e designer com workspace queryable, agente de análise, design system claude design e live artifact pessoal de tracker de adoção.
cada processo importante captura artefato que alimenta camada de inteligência que se auto-melhora. open-loop vira closed-loop. y combinator chamou essa camada de "company brain": extrai conhecimento fragmentado dos sistemas e do time, estrutura como skills file, agentes operam de forma confiável.
diana hu · yc · 2026 · request for startupsnão é camada técnica. é decisão de tese de empresa. capabilities atômicas, world model por cliente, intelligence layer que compõe soluções proativamente. atlassian: alguns times produzem 2-5x mais output operando como orquestração de agentes. "two-pizza teams viraram one-pizza teams" em uma empresa de 200 anos.
block + sequoia · mar/2026 · atlassian · pragmatic summit · fev/2026os próximos passos podem se desdobrar como acompanhamento de adoção, consultoria ai-native por squad, workshop executivo ou discovery de oportunidades. a depender de onde o time quiser priorizar.
fundador da rabbity. mais de quinze anos em produto e estratégia digital, com passagens por times de produto em escala e consultoria de transformação. especialista em sdd, padrão executor + advisor, design system como infra e infraestrutura ai-native para times de product management e product design. opera diariamente no método que ensina, e leva esse método para o workshop com o material calibrado no contexto do time.
manda uma mensagem no whatsapp. resposta no mesmo dia útil. a conversa começa por contexto: o time de product management e product design, o momento, o que está engargalando, o que se quer destravar. depois disso, se fizer sentido, mando a proposta calibrada.