Olá. Faz muitos anos que não mexo com estatísticas, esqueci como faz.
Preciso definir classes numa amostra, e quero fazer matematicamente, não no "olhometro". Seguinte:
Em 2022, o aproveitamento dos times do brasileirão foi assim:
POS: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||||||||
2022 | 71,00% | 64,00% | 61,00% | 57,00% | 54,00% | 51,00% | 51,00% | 48,00% | 47,00% | 46,00% |
11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
46,00% | 41,00% | 40,00% | 39,00% | 37,00% | 36,00% | 32,00% | 32,00% | 31,00% | 19,00% |
No olhometro, e tambem baseado na zona de classificação para libertadores, sula e rebaixamento, minha tendencia é definir:
Classe 1: >= 57% Classe 2: 50% até 56,9 Classe 3: 42% até 49,9% Classe 4: 35,1% até 41,9% Classe 5: <=35%
Como posso fazer isso de um jeito mais matemático? Talvez um ano tenham 5 classes, outro 4, outro 6. Como eu definiria a quantidade e os limites de cada classe baseado nessa amostragem?
No momento, estou avaliando esses dados de aproveitamento de 2006 até 2022. Estou vendo a média de aprov para cada posição do 1 ao 20. Vou usar as distâncias entre o aproveitamento médio de cada posição para definir as classes. Talvez eu use o desvio padrão. Mas, sinceramente, estou inventando, não sei se o que estou fazendo tem qualquer fundamento técnico.
Se alguém puder ajudar, desde já muito obrigado.