Métricas de fluxo — um guia rápido de uso

Gustavo Cocina
10 min readMar 4, 2021
Métricas são instrumentos para entender a variação no trabalho do conhecimento e melhorar continuamente

As métricas de fluxo são ferramentas importantes para evolução contínua de times — ágeis ou não, de tecnologia ou não. A interpretação tempestiva e correta das principais métricas alavanca as mudanças necessárias para se conseguir um fluxo de trabalho estável e previsível, atender plenamente as necessidades de negócio e reduzir a sobrecarga de trabalho da equipe.

Em times formados há pouco tempo, é bem possível que existam muitas disfunções que se refletem em um fluxo longe de ser estável. Nesse caso, trabalhe essas disfunções e consiga um pouco de estabilidade antes de tornar as métricas públicas, pois elas podem virar um instrumento muito indesejado de pressão sobre o time, e portanto se transformar em um fator desmotivador, o que gera resistência e estagnação.

Se em seu ambiente de negócios existem softwares para controlar o fluxo de trabalho e ferramentas de extração e análise visual de dados que a eles se conectam, existe uma oportunidade de ouro de trazer as métricas ao alcance de todos. Se não houver essas facilidades, não navegue no escuro, produza métricas você mesmo usando quaisquer ferramentas disponíveis. Todos os gráficos abaixo são casos reais produzidos com planilha eletrônica.

O objetivo deste guia não é explicar como produzir métricas e os conceitos e cálculos estatísticos que as embasam, mas sim servir como um guia rápido de quando usar e como interpretar as principais métricas para quem já tem um conhecimento básico a respeito.

As métricas abordadas aqui são lead time, throughput e WIP (work in process, ou trabalho em andamento), variáveis importantes relacionadas a fluxo de trabalho, além do CFD — Cumulated Flow Diagram — que traz a evolução desses três dados no tempo.

Lead time

O histograma de lead time desenha o formato da distribuição pela dispersão dos percentis, possibilitando avaliar se ela é de cauda fina — thin-tailed, indicando fluxo estável e previsível — de ou cauda grossa — fat-tailed, indicando fluxo instável e imprevisível por ter grande variação no lead time.

Histograma de lead time com percentis usados para avaliar o formato da distribuição

Avalie se para o contexto no qual seu time está inserido faz sentido avaliar o tempo total (customer lead time). Em times que já se comprometem com a entrega de uma história assim que ela é cadastrada, faz sentido monitorar o tempo total, que inclui a fase de product discovery. Já em times que usam a fase de discovery para compor um banco de opções de negócio para depois selecionar a opção de maior valor quando estão prontos para iniciar um novo trabalho, provavelmente fará mais sentido monitorar e otimizar apenas a fase de delivery, pois pode levar muito tempo até que alguma iniciativa de menor valor seja selecionada para ser entregue.

No trabalho do conhecimento a variação do lead time é tamanha que a média não é significativa. Deve-se entender a variação inerente ao trabalho e mitigar a variação por causas extrínsecas ao trabalho em si (quantidade de itens de trabalho em andamento, tempos de fila, bloqueios e dependências).

Times com distribuição de lead time de cauda curta (thin-tailed) podem usar os percentis da distribuição para obter previsibilidade de entrega para novas demandas entrantes.

Histogramas de lead time no tempo revelam se o lead time tende a se estabilizar ou dispersar

Acompanhar a evolução no tempo dos percentis da distribuição de lead time permite identificar se as mudanças realizadas nos aspectos que envolvem um fluxo de trabalho (processos, ferramentas, pessoas) representam melhorias ou se foram inócuas e até mesmo prejudiciais ao fluxo.

O gráfico de controle exibe cada item de trabalho e seu lead time, permitindo análise individual de atrasos

O gráfico de controle identifica os itens de trabalho específicos que ofendem os percentis de lead time, permitindo que o time analise fatores que frequentemente causam atraso.

Como interpretar

Em estatística descritiva, os percentis são medidas que dividem a amostra — por ordem crescente dos dados — em 100 partes, cada uma com uma percentagem de dados aproximadamente igual. Portanto: o 50º percentil, também chamado de mediana, divide a distribuição em duas partes de igual número de elementos (no nosso caso, os elementos são itens de trabalho — histórias, bugs, etc). O percentil 75, também chamado de 3º quartil, divide a distribuição em uma parte com 75% dos itens e outra parte com 25% dos itens. O percentil 95 pode ser usado para se eliminar aqueles 5% de itens que apresentam lead time tão destoante dos demais, que podem ser avaliados como outliers (lead time muito longo devido a causas especiais fora do controle do time).

Os percentis 50, 75, 85 e 95 exibidos no gráfico são comumente usados para se obter as probabilidades de se alcançar os lead times associados a eles, sendo que a diferença entre 100 e o percentil analisado (50, 75, 85 e 95) é o risco do lead time não ser alcançado. Ou seja, os percentis de lead time ajudam a fazer previsões de entrega com determinado grau de confiança contra o risco de não entregar.

Quanto mais distantes da mediana (50%) forem os valores de lead time dos percentis mais altos, maior é sua variação e menor é a previsibilidade das entregas do time.

Analisar como esses percentis de referência se comportam mensalmente ajuda a entender se o fluxo de trabalho é estável, assim permitindo que se faça previsões de entrega com grande grau de confiança.

Quando usar

Se você está em um time ágil, aproveite para fazer entre iterações (ex.: retrospectiva do Scrum). Senão, comece quinzenalmente e avalie se essa é uma frequência adequada para tomar decisões e colher resultados.

Throughput

Analise o throughput (taxa de vazão) para entender se existe tendência de aumento ou redução da produtividade. Assim você consegue fazer previsões do tempo necessário para se alcançar um objetivo de negócio.

A evolução do throughput no tempo pode ser por sprint caso seja um time Scrum
Use percentis baixos para entender o risco do throughput desejado não ser atingido novamente

Como interpretar

Em caso de crescimento do throughput, avalie também indicadores de qualidade (bugs gerados em produção, aumento da dívida técnica) para saber se o crescimento é sustentável ou se ele pode ser interrompido por trabalho não planejado de estabilização de entregas passadas. Avalie também como vai a satisfação das pessoas do time em relação ao trabalho (sobrecarga, turnover, pressão excessiva, etc.).

Em caso de redução da produtividade, avalie com o time como está no dia a dia a resolução de impedimentos e dependências, bem como a atuação para identificar e melhorar gargalos locais e corporativos.

Se o throughput tem tendência de redução ou tem muita variação e não segue uma linha de tendência, é possível que o time esteja com WIP muito alto, de forma que lotes de trabalho grandes demorem muito para serem entregues. Nesse caso, considere reduzir o WIP para começar a trazer estabilidade para o fluxo de trabalho.

Quando usar

Se você está em um time ágil, use nos eventos que acontecem no início e no final das iterações (ex.: no Scrum, a planning, a review e a retrospectiva). Senão, comece quinzenalmente avalie se essa é uma frequência adequada para tomar decisões e colher resultados e ajuste de acordo.

Use o throughput também para avaliar o progresso em relação a um objetivo, por exemplo: quantos itens de trabalho de um certo valor de negócio foram concluídos e quantos restam.

Use o histograma de throughput para planejar o próximo período de trabalho de acordo com um throughput de risco baixo.

WIP

Gerenciar o trabalho em andamento é a principal coisa a ser feita para estabilizar um fluxo de trabalho, evitando os atrasos e o acúmulo de itens de trabalho no processo de entrega.

O WIP aging traz os itens de trabalho potencialmente ofensores aos percentis de lead time
A quantidade de trabalho em andamento frequentemente tem relação com o lead time

Como interpretar

A partir dos itens de trabalho com maior aging, investigue com o time se existe algum bloqueio ou dependência não resolvida.

Complemente a análise comparando os itens mais atrasados com os percentis da distribuição de lead time — especialmente os mais elevados — para saber se o item é um potencial ofensor para a previsibilidade do time.

Se o time possui poucos itens de trabalho no fluxo de entrega, dedique algum trabalho para itens na etapa de refinamento, de forma que existam itens preparados para iniciar a entrega quando os itens mais avançados no fluxo forem concluídos. Assim, se consegue um fluxo saudável, sem starvation na entrega, o que é um gerador de desperdício de capacidade produtiva, pois não há trabalho a ser feito.

Se houver tendência de aumento do WIP no tempo, complemente a análise com a variação do lead time e do throughput no tempo, para saber se o time está demorando mais para entregar lotes de trabalho menores. Se este for o caso, reduza o WIP e avalie como o fluxo se comporta. Resultados desejados para uma intervenção como essa são aumento do throughput, redução do lead time, melhora da qualidade e, o mais importante, redução da sobrecarga de trabalho no time.

Se houver tendência de redução do WIP no tempo, complemente a análise com a variação do throughput e do lead time no tempo, para saber se o time está entregando mais e mais rápido ou menos e mais devagar. Se estiver entregando menos, possivelmente está havendo starvation no fluxo (ócio na capacidade produtiva). Neste caso, aumente o WIP de maneira controlada a avalie como o fluxo se comporta. O resultado esperado das intervenções é o aumento e a estabilização do throughput.

Quando usar

Avalie o WIP aging diariamente e dê foco nos itens de trabalho com aging mais elevado que já estão no fluxo de entrega.

Quinzenalmente ou a cada iteração, avalie a variação da quantidade de WIP e se há correlação com lead time e throughput.

Cumulated Flow Diagram

O CFD não apenas é uma foto do que está em cada etapa do fluxo de trabalho do time, ele é o filme do fluxo. Esse filme conta a história dos gargalos e do trabalho empurrado e seu impacto no tempo de entrega. Se existirem tendências de aumento de throughput, lead time e WIP, elas são claramente visíveis no CFD.

Como interpretar

Cada faixa desenhada no CFD representa uma etapa do fluxo de trabalho e exibe nela a variação no tempo da quantidade de itens de trabalho. O CFD é sobre entender as variações.

Via de regra, identifica-se um gargalo no CFD procurando uma faixa estreita sob uma faixa larga. No entanto, isso pode não ser verdade se o trabalho é empurrado em vez de puxado e se etapas de espera — filas — não são modeladas no fluxo de trabalho.

Um CFD pode ter muitíssimas diferentes variações, de acordo com a forma como o trabalho é conduzido.

O CFD é o filme do fluxo de trabalho de um time

O CFD acima mostra um grande aumento do WIP no tempo, o que acarreta na desestabilização do fluxo, com lead time cada vez maior e throughput cada vez menor. O backlog também aumenta mais rapidamente do que a quantidade de entregas, o que leva a mais demora e insatisfação.

A relação entre WIP, lead time e throughput pode ser enxergada no CFD

No CFD acima o WIP em 20/08 é de 21 itens de trabalho, que foram completados 3 semanas depois, ou seja, a vazão é de 7 itens por semana. Mas o tempo passou e o WIP foi aumentando: em 15/10, ele já passou a 48, que levou ao lead time de 12 semanas, com vazão de 4 itens por semana. Após essa data o WIP continuou e já não é mais possível calcular lead time e throughput por não haver mais trabalho entregue. Este é um fluxo cada vez mais instável e imprevisível.

Veja na seção de links abaixo alguns conteúdos específicos com diferentes configurações de CFD que vão ajudar a reconhecer gargalos, fluxos interrompidos e outras disfunções.

Quando usar

Quinzenalmente ou a cada iteração, avalie como o CFD se configura e diagnostique com o time os acontecimentos que lavaram a uma determinada configuração, para que se descubra os problemas e se possa intervir para resolvê-los.

--

--