Skip to main content

A sua definition of done provavelmente é fraca demais para produtos com IA

April 27, 2026
Image
DoD e IA

 

Durante anos, muitas equipas usaram a Definition of Done como uma checklist simples: código desenvolvido, testes executados, funcionalidade integrada e pronta para produção. Em muitos contextos, isso já representava um avanço importante.

Mas o contexto mudou.

Hoje, cada vez mais produtos incorporam capacidades de Inteligência Artificial: recomendações automáticas, geração de texto, classificação de documentos, assistentes conversacionais, previsões, deteção de padrões ou automação de decisões. E quando a natureza do produto muda, também os critérios de qualidade precisam de evoluir.

Uma Definition of Done que poderia ser suficiente para ter um incremento terminado em desenvolvimento de software tradicional pode revelar-se perigosamente incompleta para produtos com IA.

O problema não está no código

Uma equipa pode entregar uma funcionalidade tecnicamente impecável e, ainda assim, disponibilizar algo problemático aos utilizadores.

Imagine uma funcionalidade de apoio ao cliente baseada em IA que sugere respostas automáticas aos operadores humanos.

Tudo parece pronto:

  • Código concluído
  • Testes unitários executados
  • Deploy realizado
  • Interface funcional
  • Sem bugs críticos

Mas poucos dias após o lançamento surgem problemas:

  • Sugestões incorretas em casos sensíveis
  • Respostas demasiado confiantes quando a IA não sabe
  • Conteúdo inconsistente entre idiomas
  • Operadores a aceitar respostas erradas por excesso de confiança no sistema
  • Dificuldade em perceber por que razão certas sugestões foram feitas

O produto estava “Done”?

Técnicamente talvez. Na prática, não.

Um exemplo simples e realista

Várias organizações começaram a implementar sistemas automáticos de triagem de CVs para acelerar recrutamento.

A intenção é boa: reduzir o tempo de análise e aumentar a eficiência.

Em alguns casos, os sistemas aprenderam com dados históricos. E como os dados históricos refletiam decisões humanas passadas, também carregavam enviesamentos existentes. O resultado foi simples: o sistema passou a favorecer determinados perfis e penalizar outros sem que isso fosse explícito.

O software funcionava. O algoritmo corria. A performance técnica parecia aceitável.

Mas faltava qualidade onde realmente importava.

O problema não era “o modelo”. Era a ausência de critérios de qualidade adequados no momento de definir o que significava estar concluído.

Uma importante lição é que a DoD, compromisso do artefacto incremento, bem como o Scrum no seu todo, é cada vez mais importante na Era da IA

A Definition of Done continua a ser um compromisso

No Scrum, a Definition of Done é um compromisso do Incremento. Ajuda a criar transparência sobre o nível de qualidade esperado e permite inspeção real sobre aquilo que foi produzido.

Não é um documento estático. Não é um template universal. E não serve apenas para satisfazer auditorias internas.

É uma ferramenta viva que deve evoluir com o produto, com os riscos e com o contexto.

Se o produto evolui para incorporar IA, a Definition of Done também deve evoluir.

O que pode faltar numa DoD para produtos com IA

Dependendo do contexto, uma equipa poderá precisar de incluir critérios como:

  • Validação da qualidade e atualidade dos dados usados
  • Testes com cenários inesperados ou ambíguos
  • Verificação de enviesamentos relevantes
  • Monitorização de performance após release
  • Capacidade de fallback ou reversão segura
  • Supervisão humana em decisões críticas
  • Clareza para o utilizador sobre limites do sistema
  • Logging adequado para investigação posterior
  • Revisão de riscos éticos e legais aplicáveis
  • Critérios de segurança específicos para prompts, inputs e outputs

Nem todos os produtos precisam de tudo isto. Mas muitos precisam de algo mais do que “passou os testes”.

A verdadeira pergunta

A pergunta não é:

A nossa IA funciona?

A pergunta é:

Podemos confiar nela no mundo real?

São perguntas diferentes.

Um sinal de maturidade

Equipas maduras não tratam a Definition of Done como burocracia. Tratam-na como um mecanismo de aprendizagem.

Sempre que surge um incidente, uma falha de qualidade ou um risco inesperado, existe uma oportunidade para melhorar a DoD.

É assim que a qualidade evolui. Não por slogans. Por empirismo.

Para refletir com a sua equipa

Na próxima Sprint Planning, Sprint Review ou Retrospective, experimente discutir:

  • O que significa qualidade no nosso produto atual?
  • A nossa DoD protege utilizadores ou apenas valida entregas?
  • Que riscos novos surgiram com IA?
  • O que aprendemos recentemente que deve entrar na DoD?

Estas conversas podem ser mais valiosas do que dezenas de tarefas no backlog.

Quer aprofundar Scrum e IA?

Se quer explorar como a Inteligência Artificial impacta equipas, liderança, qualidade e entrega de produto no contexto do Professional Scrum, conheça a formação PSM-AI Essentials da Scrum.pt:


What did you think about this post?

Comments (0)

Be the first to comment!