futebol brasileiro

O futebol brasileiro é historicamente manipulado?

Tempo médio de leitura: 8 minutos

“O campeonato foi roubado para o Fulano!”
“Chora mais!”

O trecho de diálogo representa boa parte da tônica das discussões nas últimas rodadas de qualquer Campeonato Brasileiro. Os constantes erros de arbitragem, as decisões escabrosas da CBF, a corrupção nos altos escalões do futebol nacional e internacional alimentam, no imaginário coletivo, o clima de teoria da conspiração de torcedores rivais. Será que o campeonato é “roubado” mesmo?

A hipótese

Não tenho ferramentas para avaliar se o último Brasileirão foi manipulado ou se um time em específico é sempre beneficiado, porém, não há motivo para duvidar desse campeonato sem duvidar dos anteriores. Qualquer sessão de comentários prova que alguém sempre duvida de todos os anteriores.

Tomado por essa curiosidade um tanto mórbida, resolvi procurar uma forma de analisar o histórico de nossos clubes e responder no longo prazo, o quanto o futebol brasileiro é influenciado por fatores extra-campo. Existiram casos como a Máfia do Apito em 2005, contudo, são situações pontuais, ou representam o padrão?

Vamos partir da seguinte hipótese: os campeonatos não são manipulados. Ao final veremos se ela se confirma ou é quebrada. Como avaliar isso?

A metodologia

Grande parte da dificuldade de se chegar a uma resposta está em modelar o problema. O Brasil tem inúmeros times, com características regionalizadas, diferentes apelos, desempenhos históricos e etc.

Como os clubes são muito diferentes, precisamos primeiramente de um consenso. O mais simples de se obter é o dos 12 clubes grandes brasileiros, em caráter nacional: Atlético-Mg, Botafogo, Corinthians, Cruzeiro, Flamengo, Fluminense, Grêmio, Internacional, Palmeiras, Santos, São Paulo e Vasco.

Sempre haverá o que questionar na escolha do grupo, contudo, o fato de serem constantemente associados a tal posição condiz com: o apelo nacional (não é número de torcedores simplesmente, mas o valor/relevância da marca para o público geral); a existência de períodos de grande desempenho e fama de elencos estelares (alguns mais recentes, outros mais antigos); além da localização em centros mais valorizados do futebol.

Conseguida a amostra de clubes, precisamos de um critério que possa diferenciá-los. O de mais fácil acesso é o número de títulos. Há um detalhe aqui, no entanto. O Campeonato Brasileiro tem uma realidade diferente com relação à Libertadores. Os possíveis manipuladores brasileiros, se existem – mídia, patrocinadores, atletas, redes de apostas, federações e confederação – tendem a disputar influência no espectro nacional, mas o interesse tende a convergir (ou a disputa perde força) em “águas internacionais”.

Qualquer time brasileiro em uma final de Libertadores ou Mundial, em alguma dimensão, representa o Brasil – ainda que com torcidas rivais contra -, e outros manipuladores internacionais poderiam tentar puxar a corda para suas próprias nações. Por esse motivo, precisamos de ao menos dois tipos de títulos:

  • Nacionais: será o grupo de teste. Campeonato Brasileiro, Copa do Brasil, os títulos disputados simultaneamente pelos times do G12, com poucas variações na quantidade de participações.

  • Internacionais: será o grupo de controle. Libertadores, Mundial de clubes, Sul Americana, Mercosul e Conmebol. Esses torneios têm maior variação no número de participações, tendo forte influência no número de títulos. Assumimos que, à medida que um clube brasileiro avança nessas competições, mesmo que exista manipulação no Brasil, esta os atenderá igualmente ou será neutra fora do território nacional.

Definido o G12 e o critério comparativo, a próxima premissa assumida é: historicamente, os clubes do grupo têm chances iguais de título.

A premissa deve ser vista com cautela. Os clubes não começarão o campeonato 2017 com chances iguais. Elenco, situação financeira, presença de um ou mais craques, estádio próprio, entre outros fatores, favorecem alguns clubes frente a outros. Historicamente, no entanto, as diferenças causadas por esses fatores tendem a perder efeito, por serem temporais.

Essa premissa pode ser validada ao longo do estudo, pelos resultados do grupo de controle (títulos internacionais).

Vamos dividir o G12 em dois subgrupos, de acordo com muitas das teorias da internet: o eixo Rio – São Paulo, com oito clubes, e o grupo Sul – Minas, com quatro. Essa divisão responderá a hipótese definida da seguinte maneira: “Há indício de favorecimento ao grupo X frente ao grupo Y, pois o número de títulos que conseguiu está acima do esperado em um cenário aleatório”; ou “Nenhum dos grupos é favorecido, pois o número de títulos de ambos estão dentro do esperado em um cenário aleatório”.

Então temos aqui dois trabalhos: definir o “esperado”, e fazer a avaliação. Ao longo do artigo, usaremos apenas dados fechados até o fim de 2016.

Parte 1 – o valor esperado

O raciocínio de que os times do G12 carregam chances iguais de títulos nacionais traz um valor esperado claro: 8 clubes fazem parte do conjunto Rio-SP (2/3 de 12), 4 estão no conjunto Sul-Minas (1/3 de 12). Essa é a divisão inicialmente esperada de títulos entre os dois conjuntos.

Agora, devemos testar esse valor com o grupo de controle. Contabilização dos títulos internacionais:

Títulos Internacionais

ClubesLibertadores da AméricaMundial / Intercontinental de ClubesSul AmericanaRecopa Sul AmericanaCopa ConmebolSuper Copa Sul AmericanaCopa Mercosul
Atlético-Mg1--12--
Cruzeiro2--1-2-
Grêmio21-1---
Internacional2112---
Sul-Minas721522-
Botafogo----1--
Corinthians12-1---
Flamengo11----1
Fluminense-------
Palmeiras1-----1
Santos32-11--
São Paulo331211-
Vasco1-----1
Rio-SP10814313
Total G12 = (Rio-SP) 30 + (Sul-Minas) 19 = 49

Nesse 1º passo, vemos a proporção dos títulos. O maior desafio de contar somente com os títulos é perder uma visão de eficiência/favorecimento. Um clube que conquista o título é mais eficiente (ou favorecido) do que um clube que só participa, e comparando a taxa de eficiência entre os dois grupos (Rio-SP e Sul-Minas), poderíamos estabelecer um controle mais fidedigno para a hora de olhar os títulos nacionais. Vamos dar uma olhada nas participações:

Participações Internacionais

ClubesLibertadores da AméricaMundial / Intercontinental de ClubesSul AmericanaRecopa Sul AmericanaCopa ConmebolSuper Copa Sul AmericanaCopa Mercosul
Atlético-Mg81615-1
Cruzeiro15253-104
Grêmio162512103
Internacional11263---
Sul-Minas5072287208
Botafogo4-612--
Corinthians132412--
Flamengo1215--104
Fluminense6-5-3--
Palmeiras1615-1-4
Santos12351110-
São Paulo18394164
Vasco825-214
Rio-SP8912447102716
Total G12 = (Rio-SP) 205 + (Sul-Minas) 122 = 327

O risco em usar as participações para criar a taxa está em reconhecê-la como um universo (campo amostral) com regras diferentes do universo dos títulos. Apenas um título pode ser conquistado por campeonato – em tese né galera, em tese -, enquanto muitas participações são simultâneas de vários campeonatos. Também temos participações de muitos clubes em torneios que não foram vencidos por qualquer um deles, como em 2016, por exemplo. Essa preocupação nos afeta em partes: por um lado basta avaliarmos como esses dois grupos se comparam entre si, então não importa que títulos argentinos, ou da Chapecoense na Sul Americana de 2016, por exemplo, não entrem na conta.

Precisamos pesar as proporções de títulos e participações:

Sul-Minas: 19/122 = 0.1557
Rio-SP: 30/205 = 0.1463
Total G12: 49/327 = 0.1507

Nosso intuito é, usando a relação de títulos (ponderados por participações) internacionais dos grupos, refinar o valor esperado de títulos para cada grupo (que inicialmente eram 1/3 e 2/3).

Para isso, comparamos as proporções títulos/participações de cada grupo com a proporção títulos/participações totais. Essa comparação estabelece o seguinte: Se a divisão de títulos/participações de um grupo for igual a divisão de títulos/participações do todo, então os valores esperados iniciais (1/3 e 2/3) já estão ajustados. Já sabemos que essa comparação não dará um resultado igual, afinal a eficiência dos clubes Sul-Minas se mostrou um pouco maior nos torneios internacionais, como visto nas proporções acima. Calculando o ajuste, portanto:

Sul-Minas: (19/122)/(49/327) = y/(1/3)
Rio-SP: (30/205)/(49/327) = x/(2/3)

Sul-Minas: Y = 0.3464
Rio-SP: X = 0.6511

“Ei, Yann, os dois valores não somam 1!”

É verdade. Como as naturezas dos universos comparados (títulos e participações) são diferentes, e temos diferentes proporções em cada um, na hora em que fazemos essa razão ponderada, inserimos um ruído nos dados. É aqui que fazemos um ajuste, desprezando esse ruído, para podermos trabalhar com esses dados como sendo do mesmo universo, ou seja, “somando 1”.

Com esse resultado, podemos esperar que o eixo Rio-São Paulo, com 8 times, conquiste 65% dos títulos internacionais destinados ao G12. Já o grupo Sul-Minas, com 4 times, conquista 35% desses títulos. Algo bem próximo dos 67% e 33% que seriam esperados. Portanto, vamos assumir para fins desse ensaio uma margem de erro de 2%.

Parte 2 – Valor Real

Agora temos que contabilizar os títulos nacionais:

Títulos nacionais

ClubesBrasileirão 1959-2016Copa do Brasil
Atlético-Mg11
Cruzeiro44
Grêmio25
Internacional31
Sul-Minas1011
Botafogo2-
Corinthians63
Flamengo53
Fluminense41
Palmeiras93
Santos81
São Paulo6-
Vasco41
Rio-SP4312
Total G12 = (Rio-SP) 56 + (Sul-Minas) 21 = 77

No âmbito nacional, muitos devem ter chegado a essa parte do texto grilados de ver times excluídos desse chamado G12. Como assim total é a soma dos títulos desses dois grupos, apenas? Há uma forma de suavizar o impacto da premissa que tomamos, e que nos atende agora, no momento de coletar as participações: contabilizar dados apenas dos campeonatos que terminaram com algum dos times do G12 como campeões. Dessa forma, não estamos ignorando os títulos de times como Guarani ou Bahia no Brasileirão, como se não existissem. Estamos restringindo o universo, somente aos torneios em que os vencedores fazem parte da nossa análise.

Portanto, as participações não incluem as edições do Brasileirão de: 1959 / 1978 / 1985 / 1987 / 1988 / 2001. Também não entram na conta, para a Copa do Brasil: 1991 / 1999 / 2004 / 2005 / 2008.

Obs: 1987 não contou título para o Flamengo nessa análise, e com isso cai no critério de não contar nas participações de todos os times. Incluir ou não seria estatisticamente insignificante, mas deixo para você fazer a prova, se quiser. Ou “gritar” nos seus próprios comentários.

Participações nacionais

ClubesBrasileirão 1959-2016Copa do Brasil
Atlético-Mg4622
Cruzeiro5019
Grêmio5018
Internacional4518
Sul-Minas19177
Botafogo4419
Corinthians4216
Flamengo4517
Fluminense4417
Palmeiras4717
Santos4913
São Paulo4316
Vasco4220
Rio-SP356135
Total G12 = (Rio-SP) 491 + (Sul-Minas) 268 = 759

21/268 = 0.0991
56/491 = 0.1573
Total G12: 77/759 = 0.1014

Se tomarmos 1/3 e 2/3 como valores esperados:

Sul-Minas: (21/268)/(77/759) = y/(1/3)
Rio-SP: (56/491)/(77/759) = x/(2/3)

Sul-Minas: Y = 0.2575
Rio-SP: X = 0.7495

Se tomarmos o cálculo feito para as competições internacionais como valores esperados:

Sul-Minas: (21/268)/(77/759) = y/0.3464
Rio-SP: (56/491)/(77/759) = x/0.6511

Sul-Minas: Y = 0.2676
Rio-SP: X = 0.7320

Ou seja, dependendo do valor esperado que usarmos, podemos dizer que os times do grupo Sul-Minas conquistam 25% ou 27% dos títulos do G12, enquanto os times de Rio-SP conquistam 75% ou 73% dos títulos nacionais, ponderados por participações dos clubes. Se adicionássemos o a Copa União como 6º título do Flamengo, apesar da mínima diferença no valor final, só contribuiria para aumentar a proporção de Rio-SP, aumentar a diferença entre os grupos.

Lembrando do nosso intervalo de 2% como margem de erro: se comparamos esse resultado com os títulos internacionais, que nos mostraram resultados de 35% e 65%, estamos longe do cenário aceitável. Fazendo a comparação com os títulos internacionais (usando estes como o critério de valor esperado), para passarmos dos 25% de títulos/participações do grupo Sul-Minas para os 35% esperados, seriam necessários em torno de 7 títulos, totalizando 28, mantido o número de participações.

Com essa discrepância, temos duas possibilidades. A primeira é de que o problema da análise está nas premissas. De que o cenário nacional deve contar com hipóteses diferentes do cenário internacional, para explicar porque os clubes de Sul-Minas têm um desempenho tão superior em competições não brasileiras, em comparação com as competições nacionais.

A segunda possibilidade, se entendemos os títulos internacionais como um bom critério, e as premissas assumidas ao longo do texto como razoáveis, então “algo de errado não está certo”. Fica uma sensação, no mínimo, estranha. Será que 2005 deveria realmente ser do Internacional, não do Corinthians? Será que o Galo poderia ter 3 títulos, ao invés de 1?

O meu papel vai até aqui. Quem sabe um “serumaninho” da estatística se inspira a cavar mais fundo nas premissas assumidas e dados apresentados. O Brasileirão 2017 começa agora, então, desejo boa sorte nas caixas de comentários ao longo do ano. Com certeza vamos precisar.


Gostou do texto?

Você pode receber as atualizações do Além do Roteiro inserindo o seu email abaixo e clicando em “Seguir”.


Also published on Medium.

Yann Rodrigues
Editor, também escreve em

Apaixonado por entender narrativas. Das histórias que nos encantam em páginas e telas, às narrativas que nos guiam ou aprisionam na vida.