O que são outliers dentro da estatística? Malcolm Gladwell, autor do best-seller ‘Fora de Série: Outliers’ provavelmente tinha esse conceito estatístico em mente quando nomeou seu livro. No entanto o que são eles? Qual o impacto deles dentro de um relatório?
Você já reparou que para muitas pessoas a média aritmética é a solução para tudo? No entanto, a priori, a média aritmética pode não ser o melhor caminho e análises mais elaboradas precisam ser feitas mediante a complexidade dos dados.
Quando dizemos complexidade, podemos inferir a existência dos chamados outliers, isto é, valores atípicos dentro da amostra, que caso uma média aritmética fosse feita, haveria um valor desproporcional em relação a grande maioria. Essa definição, foi analisada por Gladwell e atribuída ao contexto de pessoas que estão a par da grande maioria.
Um exemplo no mundo estatístico seria se avaliarmos a população de alguns países da América do Sul. Argentina possui cerca de 42 milhões de pessoas, Colômbia 45 milhões, Peru e Venezuela aproximadamente 35 milhões e Brasil 210 milhões.
Nessa amostra, poderíamos considerar o Brasil um outlier, visto que a população é muito superior a dos outros. Ou seja, é um número atípico dentro da amostra, o que acaba definindo um outlier. Se colocarmos países com populações muito pequenas na amostra, como a Guiana e seus 700 mil habitantes, teríamos outro outllier.