Queria discutir a importância de se analisar dados de controle de qualidade, mais especificamente de Controle Estatístico de Processo em gráficos ao invés de analisar dados de maneira tabular (vamos chamar isto de “dados crús”).
Para isso vou adotar uma abordagem bem prática em um assunto que os brasileiros dominam, o FUTEBOL.
Então a pergunta é bem simples, qual atacante é mais efetivo Messi ou Cristiano Ronaldo?
Abaixo os “dados crús” (ou tabulares para vocês decidirem e responderem nos comentários)
Time | Temporada | Jogos | Gols | Jogador |
– | – | – | – | – |
Barcelona C | 2003-2004 | 15 | 5 | Messi |
Barcelona B | 2004-2005 | 26 | 7 | Messi |
Barcelona | 2004-2005 | 25 | 8 | Messi |
Barcelona | 2006-2007 | 36 | 17 | Messi |
Barcelona | 2007-2008 | 40 | 16 | Messi |
Barcelona | 2008-2009 | 51 | 38 | Messi |
Barcelona | 2009-2010 | 53 | 47 | Messi |
Barcelona | 2010-2011 | 55 | 53 | Messi |
Barcelona | 2011-2012 | 60 | 73 | Messi |
Barcelona | 2012-2013 | 50 | 60 | Messi |
Barcelona | 2013-2014 | 46 | 41 | Messi |
Barcelona | 2014-2015 | 45 | 45 | Messi |
Time | Temporada | Jogos | Gols | Jogador |
Sporting | 2002-2003 | 31 | 5 | Cristiano Ronaldo |
Manchester United | 2003-2004 | 40 | 6 | Cristiano Ronaldo |
Manchester United | 2004-2005 | 50 | 9 | Cristiano Ronaldo |
Manchester United | 2004-2005 | 47 | 12 | Cristiano Ronaldo |
Manchester United | 2006-2007 | 53 | 23 | Cristiano Ronaldo |
Manchester United | 2007-2008 | 49 | 42 | Cristiano Ronaldo |
Manchester United | 2008-2009 | 53 | 26 | Cristiano Ronaldo |
Real Madrid | 2009-2010 | 35 | 33 | Cristiano Ronaldo |
Real Madrid | 2010-2011 | 54 | 54 | Cristiano Ronaldo |
Real Madrid | 2011-2012 | 55 | 60 | Cristiano Ronaldo |
Real Madrid | 2012-2013 | 55 | 55 | Cristiano Ronaldo |
Real Madrid | 2013-2014 | 47 | 51 | Cristiano Ronaldo |
Real Madrid | 2014-2015 | 44 | 49 | Cristiano Ronaldo |
.
Repararam que fica difícil dizer muita coisa, principalmente porque os 2 jogadores tem retrospecto muito parecido de gols. Ou seja, será necessário manipular estas informações para se concluir algo analisando dados tabulares.
Uma vez que é necessário manipular dados, já não se pode dizer que a análise é feita em cima dos “dados crús”. É exatamente neste ponto que gostaria de chegar. O Dr. Walter Shewhart (google neste nome!), escreveu a seguinte regra para apresentação dos dados para análise:
Os dados devem ser sempre apresentados de maneira a preservar a evidência neles em relação a todas as previsões e análises que possam ser feitas a partir dos mesmos.
Em poucas palavras, nenhum dado tem sentido fora de seu contexto.
Por isso que para responder a pergunta sobre o atacante mais efetivo, vamos fazer uma pequena manipulação nos dados para ver se isso ajuda você a se decidir qual atacante foi mais efetivo até agora.
Total de Jogos | Total de Gols | Média de Gols/Jogo | Média de Gols/Temporada | |
Messi | 502 | 410 | 0,82 | 34,17 |
CR7 | 613 | 425 | 0,69 | 32,69 |
.
E agora? Analisando os dados de forma tabular, os fatos mais imediatos e claros que se podem concluir são:
– Cristiano Ronaldo tem mais gols que o Messi
– Messi tem uma melhor média de gols por jogo que o Cristiano Ronaldo
– Messi tem uma melhor média de gols por temporada que o Cristiano Ronaldo
– Messi tem uma temporada a menos que o Cristiano Ronaldo como profissional e mesmo assim tem uma média de Gols/Jogo melhor que o CR7
Agora se pergunte, será que já é possível decidir qual dos dois foi mais efetivo até agora?
Creio que boa parte das pessoas responderiam que sim, e cravariam que o Messi foi mais efetivo. Alguns até cravariam que Messi é de longe o mais efetivo. Mas se a sua afirmação foi essa, eu tenho que discordar um pouco dela, não porque ela esteja errada, mas porque ela é muito superficial.
Mas qual a razão dela ser superficial, você está se perguntando? A resposta é simples. É bem improvável que os dados em tabelas, mesmo depois da pequena manipulação feita, NÃO tragam consigo o contexto. E o contexto é um dos itens mais importantes para fazer uma análise consistente. Geralmente os gráficos conseguem contextualizar dados de maneira rápida e efetiva, daí a importância de fazer uma análise utilizando gráficos ao invés de “dados crús” ou dados tabulares.
Por isso que no livro do Wheeler (no qual me baseei para escrever este POST) ele faz as seguintes afirmações sobre a utilização de dados crús ou tabulares para análises.
– Nenhuma comparação entre 2 valores pode ser global
– Os relatórios gerenciais estão cheios de comparações limitadas ou superficiais
– Os gráficos tornam os dados mais acessíveis para a mente humana do que as tabelas
– As sínteses numéricas podem suplementar os gráficos, porém nunca substituí-los
– Nenhum dado tem significado fora de seu contexto
Agora vamos analisar os mesmos dados dos jogadores, porém, de forma gráfica utilizando para isso um Box-Plot (excelente ferramenta de comparação de processos), dois gráficos de controle (sequenciais) e dois gráficos de barras (sequenciais).
InfinityQS Box Plot Messi x CR7
Barras Gols/Jogo por Temporada
Barras Gols Absolutos por Temporada
InfinityQS IX-MR Messi
InfinityQS IX-MR CR7
Vejam, que os gráficos sustentam as afirmações que o Messi é um atacante mais efetivo que o Cristiano Ronaldo, porém, notem também que podemos observar muito mais que isso. Conseguimos ver todo o contexto desta comparação e entender que:
– A média de gols por jogo de Messi é um pouco maior que a do Cristiano Ronaldo
– A média de gols por temporada de Messi é ligeiramente maior que a do Cristiano Ronaldo
– Que apesar do Messi ser mais efetivo, nas 2 últimas temporadas o Cristiano Ronaldo o superou e está em uma curva ascendente enquanto que o Messi está no sentido oposto
– Que o Messi apresentou uma efetividade ascendente até a temporada 2012-2013 e depois disso a efetividade em gols caiu ligeiramente a ponto de ser superado pelo Cristiano Ronaldo
– Que na temporada 2009 o Cristiano Ronaldo apresentou uma queda não usual em seu ritmo ascendente (provavelmente a troca de equipe afetou a efetividade dele)
– Que em termos de gols absolutos por temporada o placar é 8 x 4 para o Cristiano Ronaldo
– Que em termos de gols/jogos o placar é 7 x 5 para o Messi
– Que tanto o Messi quanto o Cristiano Ronaldo “estouraram” os limites de controle superior 2 vezes cada um, o que indica que em pelo menos em 2 temporadas eles superaram as expectativas sobre si mesmos
Em resumo, a resposta correta para o desafio proposto neste POST seria: No fundo, os dois jogadores têm números muito próximos, ou seja, os dois são bem efetivos sendo o Messi historicamente ligeiramente mais efetivo que o Cristiano Ronaldo, porém com muitas chances de isso mudar ao longo das próximas temporadas.
Viu como a análise gráfica é muito mais rica que uma análise tabular? Quanta informação mais se pode extrair quando temos a informação apresentada de maneira visual.
O mesmo acontece no CEP, imaginando (grosseiramente) que o Messi e o Cristiano Ronaldo são 2 processos (ou máquinas) que fazem o mesmo produto (gols), qual processo é mais efetivo? Qual tem que ser ajustado porque já foi melhor? Qual teve comportamento excepcional ao longo do tempo?
Creio que basta olhar os gráficos aqui apresentados para saber a resposta para controlar estes 2 processos. Em todos os casos, neste exemplo bobinho, o melhor é torcer para os processos estourarem os limites de controle!! 🙂
.
PS: Os dados (gols e jogos de cada atacante) deste POST foram extraídos do site Wikipédia no verbete de cada Jogador.