/workshop ai-first para product management e product design · /presencial in company ou remoto

produto
ai-first

do modelo mental à prática para times de product management e product design. fundamentos com vida útil longa, infraestrutura ai-native montada ao vivo e o time saindo com workspace, agentes e dashboard funcionando na segunda-feira seguinte.

6
/fundamentos com vida útil longa
7
/setups montados ao vivo
10
/entregáveis pós-workshop
01/por que agora

a virada já aconteceu nos times que mais entregam.

entre 2023 e 2026, as ferramentas de ia para produto e design viraram infraestrutura operacional. não é evolução incremental, é descontinuidade. cinco evidências, três frentes.

/01 · engenharia
uber
84%

dos engenheiros usando codificação agentic ativamente.

claude code · 70% do código em produção · ~11% sem intervenção humana.

claude code · 2025
/02 · pms
reforge
9h → 12min

prds com qualidade comparável.

45× mais rápido com o mesmo padrão de qualidade.

state of product · 2025
/03 · operação
korn ferry
10k+

colaboradores em uso real.

7 a 12 horas economizadas por semana, por colaborador.

workforce report · 2025
/04 · brasil
wow
50%

menos pessoas para chegar ao pmf entre startups que usaram ia.

97% dos fastest growers usaram ia no core do trabalho.

state of pmf · 2026
/05 · fronteira
strongdm
3 / 32k

3 engenheiros · 32 mil linhas · 3 meses.

infra enterprise · ponta extrema · sem revisão humana.

factory.strongdm · 2026
//base do workshop · lançamentos anthropic

a anthropic moveu a fronteira para a mesa de quem faz produto.

a sequência de lançamentos da anthropic em 2025 e 2026 redefiniu o que pm e product designer conseguem operar sem engenharia. claude cowork roda agentes no desktop sem código. claude design gera protótipos navegáveis com estados reais a partir de spec. live artifacts entrega dashboards conectados a apps reais. claude skills empacota playbooks como capabilities reutilizáveis. mcp conecta notion, slack e drive aos agentes em segundos.

cada um desses lançamentos é um workflow inteiro de pm ou design que antes exigia eng e que agora roda com o time de produto direto.

/implicação prática

pm e designer ganham capacidade nova, não só ferramenta nova.

quem domina esses lançamentos opera prd executável, agentes de pesquisa, protótipos com dados reais e dashboards vivos sem fila de eng. o workshop é construído em cima dessa base. o time sai usando, não assistindo.

//maturidade por categoria

onde a maturidade chegou para times de produto e design.

/01 · operacional

prototipação

figma make, v0 e claude design geram protótipos a partir de descrição em linguagem natural.

/02 · operacional

design system como infra

figma mcp transforma o sistema em interface programática. agentes leem tokens reais.

/03 · operacional

análise em escala

não 10 entrevistas, mas 200. o ganho não é velocidade, é volume processável.

/04 · operacional

documentação executável

prds deixam de ser docs para ler. viram especificações que agentes processam.

/05 · fronteira

dashboards vivos

live artifacts: páginas conectadas a apps reais que se atualizam sozinhas.

/06 · fronteira

software factories

humano escreve spec + cenários. agentes implementam até a satisfação probabilística passar.

02/o que o time leva

seis fundamentos que mudam devagar e organizam tudo o resto.

ferramentas de ia têm vida útil de semanas. o workshop foca em conceitos que mudam bem mais devagar e funcionam como base do método. cada fundamento vem com vocabulário, exemplo e critério de uso.

01

inteligência × julgamento

/o eixo central

o que delegar e o que decidir.

é o eixo zero do método. de um lado, tarefas de inteligência: coleta, transcrição, sumarização, padronização, geração de variações, classificação. nelas a ia performa melhor que humano em escala. do outro, tarefas de julgamento: priorização, conflito, decisão de produto, ética, leitura de contexto político. nelas o humano é insubstituível.

não é binário. é espectro. mapear cada workflow do time nesse eixo é o exercício pré-requisito para qualquer uso produtivo de ia. sem esse mapa, o time alterna entre subutilização (medo de delegar) e uso ingênuo (delegar o que não devia).

inteligência
ia performa melhor
julgamento
humano insubstituível
/tarefas de inteligência
  • coleta de dados
  • transcrição e síntese
  • variações de copy
  • padronização de docs
  • classificação em escala
/tarefas de julgamento
  • priorização de roadmap
  • conflito entre stakeholders
  • decisão de tradeoff
  • leitura política
  • ética e responsabilidade
02

sdd para produto

prd, discovery e validação como specs executáveis.

spec-driven development importado de engenharia para produto. todo artefato relevante (prd, brief, hipótese, mapa de discovery) passa a ser estruturado para ser lido tanto por humano quanto por agente. anatomia universal: contexto + objetivo + restrições + cenários + critério de satisfação.

o agente passa a operar sobre o spec sem reinterpretação. o pm escreve uma vez e o artefato vira insumo para gerar telas, listas de teste, perguntas de descoberta e critério de aceite. a função do pm muda: ele para de redigir docs e começa a desenhar specs.

03

padrão executor + advisor

como agentes pedem ajuda quando travam.

nenhum agente é 100% confiável. o padrão maduro tem dois loops: o executor tenta, e quando atinge limite (ambiguidade, conflito, alta incerteza, decisão fora do escopo), aciona o advisor — humano ou outro agente especializado.

desenhar essa interface de pedido de ajuda é o que separa demo de operação. o advisor não revisa tudo, ele revisa o que importa. quem domina esse padrão consegue colocar agentes em produção sem virar refém de revisão manual.

04

cenários como holdout

satisfação probabilística no lugar de critério booleano.

critério de aceite "passa ou falha" não escala em ia generativa. cada execução é levemente diferente. o método maduro é cenários como holdout: lista curada de casos de teste com expectativa qualitativa, agente roda contra todos, satisfação medida em proporção (ex: 92% de cenários atingidos).

funciona como bateria de regressão para comportamento de produto. quando algo muda no agente ou no prompt, o time roda o holdout e vê o que regrediu. é o mecanismo que permite iterar com confiança, sem confiar no "achismo" de cada pessoa.

05

quando delegar / supervisionar / fazer

critério prático para uso produtivo, não ingênuo.

três zonas claras. delegar: baixo risco de erro × alto custo humano (transcrição, formatação, deduplicação, primeira passada de pesquisa). supervisionar: risco médio × valor de revisão alto (síntese de pesquisa, primeira versão de prd, classificação de feedback). fazer: decisão crítica × julgamento intransferível (priorização, conversa difícil, decisão sobre pessoas).

a maioria dos times alterna mal entre as três zonas. uns delegam o que precisava ser supervisionado e a qualidade cai. outros fazem o que podia ser delegado e perdem capacidade. o critério explícito muda o jogo.

06

vocabulário técnico calibrado

linguagem comum com engenharia, liderança e fornecedores.

pm e designer que falam a língua certa (token, context window, eval, mcp, tool use, embedding, retrieval, agent loop, holdout) compram melhor, contratam melhor, decidem melhor. quem não fala vira refém de fornecedor com pitch bonito ou de engenheiro com argumento técnico opaco.

não é vocabulário de fachada. é a base para conversar com fornecedor sem virar cliente cativo, com engenharia sem quebrar telefone sem fio, com liderança sem virar tradutor de hype. cada termo vem com exemplo de uso e sinal de quando aplicar.

cada fundamento é introduzido em ciclo curto (ideia → demonstração ao vivo → prática guiada → síntese). nenhum bloco é palestra.

03/como funciona

infraestrutura ai-native, montada ao vivo.

o time sai do workshop com sete setups configurados e funcionando, cada um com saída concreta pronta para uso. nenhum é simulação. cada participante leva o seu workspace, agente, dashboard, com fontes reais conectadas.

01
/fundação

workspace de operação queryable

o workspace deixa de ser pasta com docs e vira base de dados queryable. cinco databases (projetos, hipóteses, decisões, pesquisas, agentes) com properties machine-readable, relations entre elas, claude project conectado via mcp e notebooklm para sumarização. resultado: pergunta natural ("quais hipóteses do squad x foram validadas no q1?") vira query estruturada em segundos. é a fundação sobre a qual os outros seis setups operam.

/stack notion + claude project + notebooklm
02
/multi-fonte

hub de pesquisa profunda

pesquisa de mercado e benchmark que durava semanas vira workflow de horas. firecrawl mcp puxa conteúdo estruturado de sites concorrentes, blogs de produto, fóruns e relatórios em escala. notebooklm consolida em base navegável com citações rastreáveis. agente faz síntese em linguagem natural sob demanda. não substitui o olhar do pm/designer, mas elimina o gargalo de coleta e padroniza a profundidade.

/stack firecrawl mcp + notebooklm
03
/caso âncora

prd executável · âncora sdd

o prd vira spec executável. estrutura padrão (problema, hipótese, cenários, critério de satisfação, restrições) escrita uma vez e reutilizada como insumo. agente lê o prd e gera, sob demanda: rascunho de telas, lista de testes, perguntas de descoberta abertas, critérios de aceite e questões para engenharia. o pm/designer continua dono da decisão e da priorização. o agente faz o trabalho mecânico de propagar a spec por todos os artefatos derivados.

/stack notion + claude project
04
/sem fila do bi

análise de dados com agente autônomo

pm e designer fazem análise de dados sem depender da fila do bi. agente em background recebe pergunta em português, escreve sql, executa, gera gráfico, escreve interpretação inicial e devolve com fonte. o time mantém autonomia sobre a maioria das perguntas e libera o bi para o que é realmente estratégico ou crítico. resultado: tempo de resposta em horas, não semanas, e bi parando de ser gargalo de descoberta.

/stack code interpreter + managed agent
05
/dois fluxos

design system + auditoria

dois fluxos complementares operando juntos. (a) figma mcp expõe o design system como interface programática: tokens, componentes, estados e estilos viram dados que o agente lê e cita. (b) claude design audita telas existentes contra o sistema, sinaliza desvios com referência à regra original e sugere correção em código. resultado: o design system deixa de ser referência manual ignorada e vira lei processável que o time consulta antes de criar e o agente verifica depois de feito.

/stack claude design + figma mcp
06
/da spec ao protótipo

validação funcional sem dev

o pm/designer leva uma spec, o agente devolve um protótipo navegável com dados realistas e estados reais (loading, erro, sucesso, vazio, edge cases). não é mock estático. é validação funcional antes de envolver engenharia. permite testar com usuário, ajustar fluxo, descartar caminho ruim e decidir antes de queimar tempo de dev. o squad chega na engenharia com a hipótese já validada em comportamento, não só em ideia.

/stack claude design + claude code
07
/fechamento do ciclo

live artifact · dashboard vivo do squad

o squad sai com um dashboard que se atualiza sozinho. métricas de adoção dos novos workflows, tracker de hipóteses, status de discovery, indicadores de saúde do produto, tudo lendo do workspace queryable do setup 01. o dashboard roda em background, atualiza em ciclos curtos e fica acessível como página viva e compartilhável. fecha o ciclo: a infra construída no setup 01 vira informação acionável no setup 07.

/stack claude cowork + mcp notion
04/metodologia e entregáveis

ciclos curtos. o time leva infra, não anotações.

cada bloco segue o ciclo fundamento → demonstração → prática guiada → síntese. nenhum bloco é palestra. e o time sai com dez entregáveis tangíveis para usar na segunda-feira seguinte.

/01 preparação prévia

contexto real, antes do workshop

sessão online de uma hora com a liderança de produto para entender contexto do time: design system, fluxos críticos, personas, métricas que importam, dores atuais e prioridades do trimestre. todo o material do workshop é calibrado nesse insumo.

/02 contexto calibrado

material sob medida, não genérico

cada exemplo, cada setup e cada exercício do workshop é calibrado no produto e nos workflows reais do time. o que sai do workshop é aplicável na segunda-feira porque foi construído em cima do que o time faz, não do que um material padrão sugere.

/03 acompanhamento assíncrono

duas semanas pós-workshop

canal direto com a facilitação para destravar o time enquanto a operação ai-native ganha tração. perguntas, ajustes de config, validação de novos workflows.

/04 saídas concretas, não slides

infra rodando, não promessas

ao final, cada participante tem workspace queryable, hub de pesquisa, prd executável, agente de dados, design system auditável, protótipo funcional e dashboard vivo. com fontes reais conectadas.

//entregáveis pós-workshop

o time leva isto na segunda-feira seguinte.

/01

slides do bloco fundamentos

passo a passo visual de cada workflow.

/02

slides do bloco setups

passo a passo de configuração de cada componente.

/03

template do workspace notion

5 databases, properties, relations, claude project com mcp.

/04

biblioteca de prompts curados

system prompts de pm e designer, síntese, prd, auditoria, live artifact.

/05

live artifact tracker de adoção

dashboard pessoal levado do setup 7, configurado.

/06

playbook sdd para produto

como decompor workflow em specs, end-to-end, em 7 contextos.

/07

mapa de oportunidades com ia

consolidado pelos facilitadores após o workshop.

/08

mapas de tarefas individuais

classificação inteligência × julgamento por participante.

/09

material de aprofundamento

infra python local + anthropic agents api.

/10

canal assíncrono de dúvidas

duas semanas com os facilitadores após o workshop.

05/o horizonte

três camadas da transição ai-native.

o workshop é a primeira camada. as outras existem como caminho coerente, não como compromisso. nenhuma delas além da primeira precisa ser decidida agora.

01
agora · semanas a 3 meses
— este workshop está aqui

adoção operacional

o time de produto opera no padrão executor + advisor com sdd, infraestrutura configurada e ferramentas integradas. cada pm e designer com workspace queryable, agente de análise, design system claude design e live artifact pessoal de tracker de adoção.

02
6 a 18 meses
próximo passo natural

closed-loop e empresa legível

cada processo importante captura artefato que alimenta camada de inteligência que se auto-melhora. open-loop vira closed-loop. y combinator chamou essa camada de "company brain": extrai conhecimento fragmentado dos sistemas e do time, estrutura como skills file, agentes operam de forma confiável.

diana hu · yc · 2026 · request for startups
03
18 a 36 meses
decisão estratégica

intelligence layer e world model

não é camada técnica. é decisão de tese de empresa. capabilities atômicas, world model por cliente, intelligence layer que compõe soluções proativamente. atlassian: alguns times produzem 2-5x mais output operando como orquestração de agentes. "two-pizza teams viraram one-pizza teams" em uma empresa de 200 anos.

block + sequoia · mar/2026 · atlassian · pragmatic summit · fev/2026

os próximos passos podem se desdobrar como acompanhamento de adoção, consultoria ai-native por squad, workshop executivo ou discovery de oportunidades. a depender de onde o time quiser priorizar.

06/quem facilita

facilitação especializada, calibrada no contexto do time.

/sergio coelho

produto + infra ai-native

fundador da rabbity. mais de quinze anos em produto e estratégia digital, com passagens por times de produto em escala e consultoria de transformação. especialista em sdd, padrão executor + advisor, design system como infra e infraestrutura ai-native para times de product management e product design. opera diariamente no método que ensina, e leva esse método para o workshop com o material calibrado no contexto do time.

07 /próximo passo

vamos conversar?

manda uma mensagem no whatsapp. resposta no mesmo dia útil. a conversa começa por contexto: o time de product management e product design, o momento, o que está engargalando, o que se quer destravar. depois disso, se fizer sentido, mando a proposta calibrada.

/formato
presencial in company
ou remoto
/preparação
1h prévia
+ 2 semanas de acompanhamento
/método
ciclos curtos
contexto calibrado · saídas concretas