Article Image

Por qué el xG (expected goals) te ayuda a ver más allá del resultado

Si sueles basar tus apuestas solo en resultados recientes o en la posición en la tabla, el xG te ofrece una mirada más profunda sobre la verdadera calidad ofensiva y defensiva de un equipo. El xG estima la probabilidad de que cada ocasión acabe en gol según características como la ubicación del disparo, el tipo de asistencia, si fue un remate de cabeza y la presión defensiva. Al usar pronósticos xG, podrás distinguir partidos en los que el marcador fue engañoso de aquellos que reflejaron la superioridad real de un rival.

Como apostador, eso significa identificar ocasiones en las que las cuotas no han ajustado completamente factores subyacentes: por ejemplo, un equipo con bajo rendimiento actual pero con un xG acumulado alto puede estar a punto de revertir su racha, o un favorito que marca mucho pero crea pocas oportunidades de calidad podría estar sobrevalorado.

Qué componentes básicos necesita conocer para interpretar modelos xG

Variables más relevantes

Los modelos xG suelen incorporar variables como:

  • Distancia y ángulo del tiro: disparos desde cerca y en ángulos favorables tienen mayor xG.
  • Tipo de jugada: remate tras pase, contraataque o rebote influye en la probabilidad.
  • Presencia de defensores y portero: si el tiro fue bloqueado o si el portero estaba bien posicionado.
  • Contexto temporal y estado del marcador: algunos modelos penalizan tiros bajo mucha presión o con defensas replegadas.

Fuentes y calidad de datos

No todos los datos son iguales. Si trabajas con pronósticos xG debes saber si el proveedor usa anotadores humanos (event data manual) o tracking (posiciones exactas de jugadores). Los datos de tracking ofrecen mayor precisión, pero suelen ser más caros. Para tus primeras apuestas, un modelo basado en event data bien curado puede ser suficiente, siempre que entiendas sus limitaciones.

Cómo interpretar pronósticos xG frente a las cuotas del mercado

Cada pronóstico xG produce una estimación de goles esperados por equipo que puedes convertir en probabilidad de victoria, empate o derrota mediante simulaciones o distribuciones (por ejemplo, Poisson o modelos más complejos). La clave es comparar esas probabilidades implícitas con las cuotas ofrecidas por las casas. Si tu modelo xG asigna una probabilidad significativamente mayor a un resultado que la implícita en la cuota, detectas una oportunidad de valor.

  • Calcula la probabilidad implícita: prob = 1 / cuota decimal.
  • Compara con tu probabilidad modelada y busca disparidades consistentes, no puntuales.
  • Controla sesgos de mercado: noticias de lesiones, rotaciones y motivación también afectan y deben incluirse.

En la siguiente parte te mostraré cómo construir un modelo xG básico, validar su rendimiento y traducir sus salidas en decisiones de apuesta concretas.

Construyendo un modelo xG básico paso a paso

Para comenzar no necesitas un equipo de data scientists: con datos de eventos (event data) y herramientas comunes puedes crear un modelo útil. Un flujo simple podría ser:

  • Recolección de datos: descarga eventos de tiros (x,y de la ubicación, tipo de jugada, cuerpo que remata, asistencia, situación de juego) de fuentes como StatsBomb, Wyscout o proveedores públicos. Asegúrate de incluir meta-datos: equipo, rival, fecha y partido.
  • Preprocesado y features: limpia duplicados y crea variables derivadas: distancia al arco, ángulo efectivo, si fue contraataque, si fue tras rebote, número de defensores cercanos (o proxy como distancia al defensor más cercano), y estado del marcador al momento del tiro.
  • Elección del modelo: para estimar la probabilidad de que un disparo acabe en gol (shot-level xG) modelos simples y robustos funcionan bien: regresión logística con regularización, o árboles (Random Forest, XGBoost) si quieres capturar no linealidades. Empieza por la regresión logística para interpretabilidad.
  • Entrenamiento y calibración: divide en train/validation/test y ajusta hiperparámetros. Recalibra probabilidades (ej. isotonic regression o Platt scaling) si el modelo tiende a sobre- o sub-estimar las probabilidades.
  • Agregación a partido: suma los xG de los tiros por equipo para obtener xG esperado de partido. Para convertir xG en distribución de goles puedes usar Poisson (lambda = xG) o una distribución negativa binomial para modelar sobremodulación de la varianza.

Este es un esqueleto que puedes complicar con tracking data, interacción entre jugadores o ajustes por contexto (cancha, calendario). Lo importante es empezar simple, medir y luego añadir complejidad solo si mejora resultados fuera de muestra.

Validación y backtesting: cómo medir si tu modelo funciona

Validar correctamente evita sobreajuste y te da confianza para apostar. Algunas prácticas clave:

  • Métricas a nivel tiro: AUC, log loss y Brier score evalúan la calidad probabilística del shot-level xG. A nivel partido, compara goles observados vs goles esperados usando MAE (error medio absoluto) o RMSE.
  • Backtesting de apuestas: simula apuestas históricas usando las cuotas reales y tu criterio de valor. Calcula ROI, yield y drawdown máximo. Usa ventanas rodantes temporales para respetar información futura (entrena solo con datos anteriores a la fecha de apuesta).
  • Pruebas de robustez: realiza pruebas con diferentes muestras (ligas, temporadas), y controla que las señales de valor no dependan de un pequeño subconjunto de partidos.
  • Calibración de probabilidades: compara frecuencias observadas con probabilidades predichas en distintos bins; un modelo bien calibrado debería tener coherencia entre ambos.

Si el rendimiento fuera de muestra es pobre o presenta grandes drawdowns, reduce la complejidad del modelo o incorpora nuevas variables (alineaciones, lesiones). La consistencia a lo largo del tiempo es más valiosa que una mejora puntual en métricas.

De pronóstico a apuesta: aplicar el xG en mercados reales

Una vez validado el modelo, transforma sus salidas en decisiones prácticas:

  • Detección de valor: calcula la probabilidad implícita de la cuota y compara con tu probabilidad modelada. Establece un umbral de valor (por ejemplo, ventaja mínima del 5% tras descontar margen de la casa).
  • Selección de mercados: los mercados que mejor se benefician del xG suelen ser over/under (usa la suma de xG esperados), Both Teams to Score (xG por equipo) y correct score (convolución de distribuciones de goles). En match odds, ajusta por rotaciones y lesiones antes de apostar.
  • Tamaño de apuesta y gestión de bankroll: usa Kelly fraccional o una estrategia de tamaño fijo basada en la varianza histórica de tus apuestas. Controla el stake cuando la liquidez o límites de mercado sean bajos.
  • Monitoreo y ajuste: registra cada apuesta con la razón del valor identificado; revisa periódicamente rendimiento y reajusta modelos o umbrales según evolucione el mercado.

Con disciplina en la validación y una gestión de bankroll estricta, los pronósticos xG pueden convertirse en una ventaja sostenible, siempre consciente de la incertidumbre inherente al fútbol.

Checklist práctico antes de ejecutar una apuesta basada en xG

  • Verifica alineaciones y noticias de última hora (rotaciones, lesiones y sanciones).
  • Confirma que tus datos y el modelo estén actualizados para la temporada y la liga en cuestión.
  • Comprueba la cuota y calcula la probabilidad implícita; asegúrate de que exceda tu umbral de valor tras descontar margen.
  • Aplica la gestión de bankroll acordada (Kelly fraccional o stake fijo) y registra la apuesta con la justificación del valor.
  • Monitorea liquidez y límites del mercado; evita stakes grandes en mercados poco líquidos.

Errores comunes a evitar

  • Sobreajustar el modelo para mejorar métricas de entrenamiento: prioriza rendimiento fuera de muestra.
  • Ignorar contexto humano: motivación del equipo, clima, viajes y rivalidad pueden cambiar resultados.
  • Confiar en muestras pequeñas: un par de partidos buenos no confirman una estrategia rentable.
  • Perseguir pérdidas aumentando stakes sin fundamento estadístico.

Cierre y pasos siguientes

Mantén la disciplina: itera sobre tu modelo con datos frescos, documenta cada apuesta y aprende de los errores. Si buscas profundizar en técnicas y ejemplos reales de event data, puedes consultar recursos como el Blog de StatsBomb para ampliar criterios y enfoques. Recuerda siempre apostar de forma responsable y considerar el análisis xG como una herramienta para mejorar probabilidades, no como garantía de resultados.