Por Matheus Gonzaga e Pedro Toledo
Incerteza. Essa é provavelmente a palavra que melhor define o que é o Draft da NBA. Nunca sabemos o que um jogador vai se tornar na liga antes de seu recrutamento: atletas considerados escolhas certeiras ao subir no palco podem não render nada em quadra e jogadores virtualmente desconhecidos entrando no recrutamento podem se tornar lendas do esporte. Muitas variáveis influenciam no sucesso ou não de um jogador, desde seus pontos fortes e fracos em quadra a aspectos como personalidade, ética de trabalho e situação em que foi colocado.
Desse modo, é naturalmente difícil o processo das equipes definirem quem devem escolher ou não e projetar quais serão suas habilidades futuramente. Um bom scouting, seguido de entrevistas e workouts, são as principais ferramentas para responder essas perguntas, mas o analytics tem se mostrado um importante aliado nesse processo.
Diversos times da NBA apresentam modelos estatísticos para tentar predizer qual será o desempenho de prospectos na liga a partir de seus dados e estatísticas no College/ligas internacionais. É claro que modelos com esse não são perfeitos (nenhum modelo estatístico é) e apresentam projeções equivocadas, mas ainda assim apresentam uma precisão relevante e que ajuda a ter uma ideia do que esperar de determinado jogador.
De modo a ilustrar como esses modelos funcionam e trazer um pouco de informação do que esperar de jogadores da classe de 2020 a partir de como jogadores similares a eles se saíram no passado, nós do Layups & Threes criamos um modelo para avaliar o desempenho esperado dos prospectos a partir de seus números no basquete universitário. O nosso sistema é com certeza bem mais simples e inferior aos das franquias, mas ainda assim apresentou uma precisão interessante.
Antes de mais nada, vale dizer que com certeza diversos jogadores irão ter performances muito diferentes do que os nossos números indicam, seja para bem ou para mal. Como já falamos, fatores externos a seus números em quadra e atributos físicos (sejam associados a sua personalidade ou ao encaixe no time para onde irá) têm grande impacto no desempenho e não são considerados a partir do viés analítico. Enxergue os números que apresentaremos como o valor esperado do desempenho do jogador a partir de como prospectos similares no passado se saíram na NBA e não como uma predição de futurologia. Dito isso, vamos falar sobre nossos dados.
O escopo de nosso modelo é o basquete universitário, isto é, só estão incorporados jogadores que jogaram na NCAA antes de se inscreverem no draft (portanto, jogadores como LaMelo Ball, Deni Avdija e Killian Hayes não farão parte dessa análise). Os motivos de fazermos isso são bem pragmáticos: em primeiro lugar, obter dados de prospectos espalhados pelo mundo é extremamente difícil, e em segundo, não é justo colocar na mesma caixa ligas diferentes na hora de predizer o que a performance nela iria refletir na NBA. Outra limitação do modelo é que consideramos apenas jogadores com 15 ou mais jogos no College (ou seja, não temos James Wiseman), por ser necessária uma massa significativa de informações para ter um modelo preciso.
Para criar esse sistema, utilizamos estatísticas de jogadores draftados do basquete universitário para a NBA nos últimos dez anos obtidas do site barttovik.com. O nosso objetivo foi “prever” alguns números desses jogadores na liga profissional norte-americana usando as informações sobre eles. Vamos então às variáveis usadas:
As nossas variáveis resposta (o que tentamos prever), foram:
- Eficiência em infiltração (Pontos por posse)
- Eficiência finalizando no aro (FG%),
- Eficiência na floater range (FG%),
- Eficiência na meia distância (FG%),
- Eficiência em Catch & Shoot Threes (FG%),
- Eficiência em Pull Up Threes (FG%),
- Percentual de Rebotes Defensivos,
- Percentual de Rebotes Ofensivos,
- Percentual de Assistências
- Razão de Assistências para Turnovers
- Proteção de Aro (FG% cedido no aro para adversários),
Cremos que esses números indicam bastante sobre a performance de um jogador na NBA atual (mas admito que faltaram indicadores de defesa de perímetro – que é extremamente difícil de avaliar a partir de números).
Para realizar essa difícil tarefa de projetar desempenho de prospectos, foram utilizadas variáveis específicas para cada uma das métricas em estudo. Isto é, as variáveis que usamos para predizer eficiência finalizando no aro, por exemplo, não foram as mesmas que foram consideradas para prever o desempenho em pull up threes. De qualquer modo, os atributos utilizados em ao menos um dos modelos foram:
- Anos passados no College (Freshman, Sophomore, Junior ou Senior)
- Altura
- Percentual de rebotes defensivos no College
- Percentual de rebotes ofensivos no College
- Percentual de assists no College
- Percentual de turnovers no College
- Percentual de tocos no College
- Enterradas feitas no College
- Volume e aproveitamento em arremessos de curta distância no College
- Volume e aproveitamento em arremessos de média distância no College
- Volume e aproveitamento em arremessos de três pontos no College
- Aproveitamento em lances livres no College
Escolhemos, para cada modelo, as variáveis que, a partir de análises descritivas, demonstraram ter impacto no desempenho de prospectos. Por exemplo, para predizer o aproveitamento no aro, utilizamos quantidade de anos no college, altura, enterradas feitas, volume e aproveitamento em arremessos curtos na NCAA, enquanto para predizer o desempenho em catch & shoot threes utilizamos o tempo de College, aproveitamento e volume na mid range, aproveitamento e volume de três pontos e aproveitamento de lances livres (que foi a variável mais impactante).
Não vou entrar muito na área técnica e na metodologia estatística/computacional do nosso sistema, mas, caso interesse aos curiosos e pessoas da área, utilizamos uma técnica de modelagem chamada XGBoost, que foi implementada no software RStudio para fazer esse processo. Caso alguém deseje saber mais sobre esse lado mais teórico, pode entrar em contato que respondo sobre com o maior prazer (além disso, quem quiser os códigos ou os bancos de dados utilizados, é só pedir!).
Ao ajustarmos o modelo usando os jogadores antigos, decidimos avaliar a qualidade dele. Para isso, usamos uma estratégia de validação cruzada (utilizamos várias combinações de jogadores desse conjunto para predizer os demais do mesmo), e obtivemos estimativas de sua precisão.
O MAE é basicamente o erro médio do modelo. Isto é, o modelo de aproveitamento de pull ups três pontos erra em média em 0.03% o aproveitamento real dos jogadores. O MAPE , por sua vez, indica quão grande é esse número considerando a escala da variável (no caso, 1.038 indica que em geral o erro do modelo é de 1.038% da média da variável).
Veja que todos os modelos são ao menos razoavelmente precisos: especialmente os de proteção de aro e de eficiência de arremessos, que foram excelentes (por exemplo, se projetarmos que um jogador irá ter aproveitamento em pull ups three de 36%, ele provavelmente terá aproveitamento entre 35.7 e 36.3%. Os de rebotes também tiveram um sucesso muito bom. Já os associados a assists tiveram precisão menor, mas ainda satisfatória, o que nos indica que eles ao menos nos dão uma noção do que o jogador se projeta a ser a partir das informações que temos. Desse modo, é claro que poucos números serão de elite, pois números altíssimos são raros e quase sempre não são o mais provável que ocorra para um atleta específico (que é o que estamos projetando).
Sem mais delongas, vamos às predições dos prospectos da classe de 2020 do Draft da NBA:
Começando pelos rebotes defensivos, é notório que se projeta que Vernon Carey, Jalen Smith e Daniel Oturu sejam os melhores da classe. A título de curiosidade, a marca de Carey é semelhante às de Steven Adams e de John Collins (não sendo um número de elite).
Sobre rebotes ofensivos, se destacam Paul Reed, Oturu e Onyeka Okongwu. Para comparações, a marca de 0.10 de Reed é próxima à de Rudy Gobert e seria melhor que a de 75% dos pivôs da NBA.
Enquanto protetores de aro, os destaques são Smith e Precious Achiuwa. O aproveitamento de 54.81% que projetamos para Jalen seria similar aos de Adams e Jaren Jackson Jr., uma marca significativamente acima da média dos pivôs da NBA, ainda que não de elite.
Já como passadores, projetamos jogadores como Malachi Flynn, Markus Howard e Cassius Winston como os com o maior percentual de assistências. As marcas de Flynn e Howard (0.28), são semelhantes às de Jrue Holiday e Fred VanVleet e estariam entre as 35 maiores dentre guards da liga.
Quanto à razão de assistências para turnovers, que mede quão bem um jogador cuida da bola, os destaques são Tre Jones, Nico Mannion e Payton Pritchard. A razão de Tre (a maior da classe) é melhor que a mais de 60% dos guards da NBA (apenas uma informação curiosa: o irmão de Tre, Tyus Jones, é o lider da NBA na categoria).
Agora vamos falar sobre eficiência de arremessos: No aro, Jalen Smith se destaca com 71.32% de eficiência projetada, seguido por Daniel Oturu e Obi Toppin. A marca projetada para Smith seria a décima sétima melhor da liga inteira, próxima a de jogadores como Bam Adebayo e Karl-Anthony Towns.
Na floater range, o melhor número é o de Tyrese Haliburton (45.61%), marca superior a aproximadamente três quartos da liga e próxima a de jogadores como Derrick Rose e Trae Young.
O caso da mid range é curioso, apenas Skylar Mays tem um aproveitamento realmente notório: 49.33% é uma marca de elite, que estaria no top 10 da NBA e próxima a CJ McCollum e Gordon Hayward.
Em arremessos de três após o drible, os que aparentam ter maior potencial são Flynn e Killian Tillie, com marcas bem eficientes de cerca de 37%, que renderiam mais de 1.1 pontos por arremesso.
Já em Catch & Shoot, há muitíssimos jogadores com aproveitamento projetado de 35% (que é um limiar para eficiência) ou mais, mas os mais notórios são Howard (42%!), Pritchard e Flynn. Outros jogadores como Anthony Edwards, Mannion e Tyrell Terry também se projetam como jogadores com mais de 40% de aproveitamento.
Já finalizando em drives, ninguém parece ser um jogador de elite, mas Saddiq Bey e Patrick Williams aparentam ser os jogadores mais promissores no quesito, chegando por volta de 0.85 pontos por arremesso.
Falando mais em geral sobre alguns dos prospectos mais hypados, nosso modelo não vê tanto potencial em Edwards (achando que será um bom arremessador de C&S e finalizador decente no aro, mas só), crê que Haliburton será um bom passador e arremessador do catch, mas nada demais. Okongwu, por sua vez, é visto como sólido enquanto reboteiro, protetor de aro e finalizador, que tem uma chance de desenvolver um arremesso eventualmente (33% não é um bom número, mas não é horrível, e é até encorajador para a projeção média de um pivô). Toppin foi projetado como ótimo finalizador no aro e que não será tão ruim o defendendo, mas o modelo não compra tão fortemente sua capacidade de arremessar do perímetro. Por outro lado, nosso sistema acha que Williams se tornará um arremessador digno e que será capaz de finalizar em diversas áreas.
Atletas como Devin Vassell e Isaac Okoro foram mal na maioria das projeções, mas isso tem muito a ver com o fato de não termos métricas para defesa de perímetro, que é o principal ponto deles. De qualquer modo, se projeta que o primeiro será um arremessador ao menos decente, ainda que não ótimo.
Entre possíveis steals, destaco que Howard, Mays, Pritchard, Tillie e Flynn se projetam como arremessadores muito bons e que Tre Jones pode se tornar um bom playmaker que não é um ponto falho como arremessador. Jalen Smith também é um jogador que se destaca: é cotado para o meio da primeira rodada, mas parece ter potencial para ser um bom protetor de aro, reboteiro e finalizador, que também é capaz de arremessar do perímetro.
É claro que projeções como essas não simplesmente fazem equipes mudarem seus alvos, mas podem servir como indicadores de jogadores a se prestar mais atenção ou acender alguns sinais amarelos quanto a outros, podendo agregar informações junto a um scouting mais aprofundando em certos aspectos e ter um peso maior com relação a jogadores na segunda rodada.
O Draft é extremamente impreciso, e com certeza ao menos um desses jogadores vai exceder muito o que projetamos para ele em alguma área. Mas isso é uma constante para scouting, entrevistas, workouts… toda avaliação de prospectos é imprecisa. O uso de analytics é uma ferramenta que pode ser útil nesse processo, é mais uma fonte de informações que junto a essas outras pode ajudar os times da NBA a selecionarem melhor na noite do recrutamento.
Siga o Layups & Threes no Twitter!