Glossaire

📖 Académie

Tous les termes techniques utilisés sur le dashboard, expliqués simplement avec un exemple chiffré. Référence pour quand un signal "edge +12pt" ou "Brier 0.18" t'intrigue.

📊 Cotes & probabilités

Cote décimale (européenne): Combien tu récupères pour 1€ misé, mise comprise. C'est la convention française et celle qu'affiche Winamax. Une cote de 2.50 = pour 1€ misé tu récupères 2.50€ en cas de victoire (donc 1.50€ de gain net).

Exemple : tu mises 10€ à la cote 1.85. Tu gagnes → tu récupères 18.50€, soit 8.50€ net. Tu perds → tu perds 10€.
Probabilité implicite: La probabilité que le marché donne à un évènement, lue à partir de la cote. Formule : p_implicite = 1 / cote. Une cote 2.00 implique 50% de chance, une cote 4.00 implique 25%.

Exemple : un match avec cote 1.50 victoire domicile → marché pense que le domicile gagne ~67% du temps (1 / 1.50). Réservé aux matchs très déséquilibrés.
Marge bookmaker (vig): Les bookmakers ne fixent pas des cotes "honnêtes". Ils ajoutent une marge (5-8% typiquement). Si tu additionnes les probabilités implicites des 3 issues 1N2, tu obtiens ≈1.05-1.08 au lieu de 1.00. C'est pour ça qu'un parieur "moyen" est perdant à long terme : il faut battre la marge.

💎 Valeur & sélection

Edge (avantage marché): Différence entre la probabilité que tu calcules et celle que le marché propose. edge = p_modèle − p_implicite. Positif = le marché sous-estime, c'est une opportunité.

Exemple : modèle dit 60% pour Lyon, cote 1.80 (implicite 55.6%). Edge = +4.4pt. Si répété sur 100 paris à edge +4pt, espérance théorique +4€/100€ misés.
Value bet: Pari où l'edge est positif. Les paris sportifs profitables se construisent uniquement sur des value bets répétés, pas sur les "coups de cœur".
Tier de fiabilité (lock / standard / lowconf / skip): Classement du modèle selon la confiance dans le pick :

lock 🔒 : prob ≥ 72% + ≥3 composants non-marché concordants. C'est le top du top.

standard ✅ : prob ≥ 55% avec couverture data minimale.

lowconf ⚠️ : prob ≥ 50% mais data thin (peu de matches, sources réduites).

skip 🚫 : prob < 50% ou inversion modèle/marché. Ne pas miser.

💰 Mise & bankroll

Bankroll (cagnotte): L'argent que tu consacres aux paris, à part de tes finances quotidiennes. Règle d'or : n'utilise que ce que tu peux perdre intégralement sans impact sur ton mode de vie.
Kelly fractionnaire: Formule mathématique qui calcule la mise optimale pour maximiser la croissance long terme : f* = (b·p − q) / b, où b = cote − 1, p = prob modèle, q = 1 − p. On applique 0.25× Kelly cap 10% bankroll par défaut.

Pourquoi 0.25× et pas Kelly plein ? Le Kelly plein est mathématiquement optimal MAIS il suppose que ta probabilité modèle est exacte. En pratique, elle a une marge d'erreur. 0.25× réduit la variance d'environ 75% en n'enlevant qu'environ 25% de la croissance — un trade-off très favorable.
Mise plate (flat stake): Mise constante par pari (typiquement 1u). Très utile pour mesurer la vraie performance du modèle indépendamment du staking. Le ROI flat est la métrique de référence.

🎯 Qualité du modèle

Win rate (WR / taux de réussite): Nombre de picks gagnés ÷ nombre total. Ne dit rien à lui seul. Un WR 60% sur des cotes 1.30 fait perdre de l'argent (perd 80€/100€ misés). Un WR 40% sur cotes 3.00 en fait gagner (+20€/100€).
ROI flat: Retour sur investissement à mise plate. (retours − mises) / mises × 100. +5% sur 200+ paris = solide. +10% = excellent. +20% sur peu de paris = variance.
Brier score: Mesure l'erreur de prédiction probabiliste, en moyenne sur tous les picks. Σ(p_modèle − résultat)² / N. 0 = parfait, 0.25 = pile/face. Un Brier < 0.22 sur ≥150 picks indique un signal réel.

Exemple : si le modèle dit 70% et la victoire arrive, l'erreur sur cette ligne est (0.7 − 1)² = 0.09. Plus on prédit confiant et juste, plus le Brier baisse.
Calibration: Quand le modèle dit "70% de chance", est-ce que 70% de ces prédictions gagnent vraiment dans la réalité ? Si oui, le modèle est calibré (honnête). Sinon, ses pourcentages sont du bruit.

On bin les picks par tranche de prob (50-60%, 60-70%, etc.) et on regarde le WR observé dans chaque tranche. Gap < 5pp partout = bien calibré.
CLV (Closing Line Value): Cote prise au moment du pick comparée à la cote juste avant le coup d'envoi. +CLV moyen sur 50+ paris = preuve qu'on bat le marché, indépendamment du résultat short-term.

C'est le signal que les bookmakers eux-mêmes utilisent pour identifier les "smart money" — les parieurs qui prennent systématiquement la cote AVANT que le marché s'aligne. Si ton CLV est positif sur la durée, tu joues mieux que le consensus.

🔬 Signaux du modèle

Elo: Note de force d'une équipe ou d'un joueur, mise à jour après chaque match. Hérité du chess (Arpad Elo, 1960s). Un écart de 100pts ≈ 64% de chances pour le plus fort. Utilisé en foot (ClubElo) et tennis (Sackmann).
Surface Elo (tennis): Elo séparé par surface (Hard, Clay, Grass). Nadal sur terre battue ≠ Nadal sur gazon. Sans cette ventilation, le modèle perd un signal majeur. Exposé pour ATP/WTA via les CSV de Jeff Sackmann.
Modèle Poisson (foot): Modèle statistique qui prédit la distribution du nombre de buts. À partir de l'attaque/défense des deux équipes, calcule la probabilité de chaque score (0-0, 1-0, 2-1...). Permet de dériver les marchés Over/Under, BTTS, score exact.
xG (expected goals): Le nombre de buts qu'aurait dû marquer une équipe selon la qualité de ses occasions. Un xG = 1.8 vs but inscrit = 0 indique malchance/grand gardien adverse. Sur la durée, xG converge vers les buts réels.
Forme L5 / L10: Résultats des 5 derniers matchs (foot) ou 10 derniers matchs (tennis Sackmann). Capté comme W/L/D dans une chaîne ("WWLDW"). Signal court-terme important mais sujet à variance.
Fatigue (tennis): Nombre de matchs joués dans les 14 derniers jours. >5 matchs = chargé, joue sur la puissance de service et la récupération. Pénalise typiquement le joueur le plus chargé contre un adversaire frais.
Pace NHL (différentiel buts/match): (Buts marqués − Buts encaissés) / matchs. Positif = équipe qui domine. Une équipe à +1.0/m vs −0.5/m = écart de 1.5/m de différence systémique.
Pitcher partant (MLB): Le lanceur qui commence le match. Sa qualité (ERA, WHIP, K/9) est de loin le signal #1 en baseball. Un même match avec deux pitchers différents peut basculer la cote de +30%.
Calibration ligue (Football-Data): Statistiques agrégées par ligue : moyenne de buts/match, taux BTTS, taux Over 2.5, win rate domicile. Permet au modèle Poisson de s'ajuster (Eredivisie ≠ Serie A en pace).

🏆 Termes par sport

⚽ xG (foot — expected goals): Pour chaque tir, probabilité estimée de marquer (basée sur position, angle, type de passe). Un match avec xG 2.4 vs 1.1 indique que l'équipe à 2.4 méritait davantage que ses buts effectifs. Plus stable que les buts réels sur petits échantillons.
⚽ Dixon-Coles τ (correction τ): Correction du Poisson naïf qui sous-estime systématiquement les scores 0-0, 1-0, 0-1, 1-1 (corrélation négative empirique en foot). Paramètre ρ ∈ [-0.30, +0.10]. Notre modèle mesure ρ par ligue via likelihood max (eng.1 ≈ -0.07, ita.1 ≈ -0.18).
🎾 Elo surface (tennis): Elo séparé par surface (Hard / Clay / Grass / Indoor). Nadal sur terre battue ≠ Nadal sur gazon — la généralisation perd un signal majeur. Source : Jeff Sackmann CSV. Différence ≥ 200pts = signal très fort.
🎾 BO3 / BO5: Best-of-3 (Masters 1000, ATP 500/250, WTA Premier) ou Best-of-5 (Grand Slam masculin). Le format change radicalement la dérivation des probas de set : sur BO5, l'effet de variance court-terme est lissé.
🏀 Pace (NBA): Possessions par 48min. Une équipe à 105 (Spurs) joue 12 possessions de plus qu'une équipe à 93 (Heat). Affecte directement le total de points (over/under) sans changer le winner. Différentiel ≥ 4 = signal flagged.
🏀 ORtg / DRtg (offensive/defensive rating): Points marqués/encaissés par 100 possessions. Indépendant du pace. ORtg 115 vs DRtg 110 = +5 points expected sur 100 poss → écart projeté du match. Notre source ESPN team_form donne PPG (points per game), proxy moins précis mais publiquement dispo.
🏒 SV% / GAA (goalie NHL): Save percentage : % de tirs arrêtés par le gardien titulaire. Élite ≥ 0.92 (Vezina-tier). Faible ≤ 0.89. GAA = goals against average per 60min. SV% est un signal direct : un goalie titulaire à 0.94 réduit l'expected goals adverse de ~12%.
⚾ ERA / WHIP (pitcher MLB): Earned Run Average = points encaissés par 9 manches. Élite ≤ 3.0. Médian ≈ 4.0. WHIP = walks + hits per inning pitched (efficacité, ≤ 1.10 = élite). Différentiel ERA ≥ 0.5 entre les 2 starters = signal majeur baseball.
🏆 Home advantage (multi-sport): Avantage du terrain. NBA ≈ 2.5 pts. NHL ≈ 5% en proba. Foot top-5 ≈ 0.35 buts. Calculé empiriquement par sport et par ligue. En baisse depuis COVID (publics moins influents).

📐 Pour le détail mathématique de la composition modèle (poids des composants, seuils des tiers, formules exactes), voir la page Méthodologie. Pour la performance vérifiée du modèle, voir la page Backtest. Pour le code, voir le repo GitHub.