English

Comment ERstat prédit les temps d'attente

La méthodologie complète, en langage clair

Résumé : Pour les hôpitaux qui ne publient pas leurs temps d'attente, nous estimons le temps d'attente probable en ce moment à partir des patrons observés dans les hôpitaux qui publient. Nous affichons une plage parce que l'attente réelle varie vraiment — la plage est réelle, ce n'est pas une échappatoire. Chaque estimation est mise à jour toutes les 15 minutes.

Deux types d'hôpitaux

Hôpitaux avec données en direct. Certaines autorités provinciales publient les temps d'attente — Alberta Health Services, Nova Scotia Health, Index Santé du Québec, ED Wait Times de la C.-B., et d'autres. Pour ces hôpitaux, vous voyez le temps que leur propre système rapporte, avec un horodatage. Aucune prédiction n'a lieu ; c'est leur chiffre. Au total, cela couvre environ 200 services d'urgence au Canada.

Hôpitaux silencieux. La plupart des urgences canadiennes ne publient pas leurs temps d'attente. Pour eux, nous estimons à partir des patrons appris des hôpitaux qui publient. Sur 474 hôpitaux silencieux, environ 394 obtiennent une estimation à chaque cycle. Les 80 autres sont des cas où notre modèle ne peut rien dire d'utile avec confiance — nous les appelons "abstenus" et retombons sur les moyennes historiques.

Estimation actuelle, pas prévision future

La prédiction d'ERstat est une estimation actuelle — une estimation de ce à quoi ressemble l'attente en ce moment, pas ce qu'elle sera plus tard aujourd'hui. Nous comblons le vide pour les hôpitaux qui ne nous disent pas leur état actuel ; nous n'essayons pas de prédire les heures à venir. Quand vous voyez "~2h 15m attente typique," c'est notre meilleure estimation de l'attente à ce moment, mise à jour il y a au plus 15 minutes.

Ce que nous entendons par "temps d'attente"

Nous utilisons une seule définition cohérente : le temps entre l'arrivée et la rencontre d'un médecin. Pas le temps de triage. Pas la durée totale de la visite. Pas le temps jusqu'à l'attribution d'un lit.

C'est important parce que différentes provinces mesurent différentes choses. Nous harmonisons tout en "temps jusqu'au médecin" parce que c'est la métrique qui compte le plus pour les patients et c'est ce que la plupart des sources provinciales rapportent. Certaines sources — par exemple le flux ArcGIS du Nouveau-Brunswick, qui rapporte la durée totale de la visite — sont exclues de l'entraînement parce que leurs chiffres fausseraient les prédictions.

Comment fonctionne la prédiction

Les données d'entraînement

Toutes les 15 minutes, nous enregistrons ce que les hôpitaux avec données en direct rapportent. Au fil du temps, cela devient un grand ensemble de données qui relie les caractéristiques observables d'un hôpital (taille, emplacement, type, heure du jour, jour de la semaine) aux temps d'attente réels.

Le modèle

Nous utilisons un ensemble de régression quantile LightGBM. En langage simple : c'est un modèle d'apprentissage automatique entraîné à prédire non pas une seule valeur attendue, mais une plage — une borne inférieure, une médiane, et une borne supérieure. Il apprend des patrons comme "les petits hôpitaux ruraux le dimanche matin ont généralement des attentes autour de X" à partir de dizaines de milliers d'observations réelles.

Les caractéristiques que nous lui fournissons incluent :

Notamment, nous n'utilisons aucune caractéristique sur l'état actuel de l'hôpital — nous ne pouvons pas, parce que par définition ce sont des hôpitaux silencieux qui ne nous disent pas leur état. C'est la limite fondamentale des prédictions pour les hôpitaux silencieux, et c'est pourquoi les intervalles sont aussi larges.

Comment nous gérons l'incertitude honnêtement

Le modèle brut nous donne une plage, mais les modèles d'apprentissage automatique tendent à être trop confiants dans leurs plages. Nous ajoutons donc une deuxième étape appelée prédiction conforme.

Nous retenons des données des hôpitaux avec données en direct et vérifions : quand le modèle dit "entre 2 et 5 heures," l'attente réelle tombe-t-elle dans cette plage 80 % du temps ? Sinon, nous élargissons la plage jusqu'à ce que ce soit le cas. Nous faisons cela séparément pour différents types d'hôpitaux (par région et ruralité) pour que l'élargissement reflète le patron d'erreur réel pour les hôpitaux similaires.

Résultat : quand nous disons que notre intervalle couvre 80 % des cas, cela signifie que l'attente réelle devrait tomber dans cette plage 80 fois sur 100. C'est une affirmation mathématiquement défendable, vérifiée sur des données réelles mises de côté, pas une intuition.

Étiquettes de confiance

Chaque prédiction est accompagnée d'une étiquette de confiance, basée sur la largeur de l'intervalle :

Confiance élevée
Intervalle de moins de 3 heures. Le modèle est en terrain familier et la plage est assez étroite pour guider une décision.
Confiance modérée
Intervalle entre 3 et 6 heures. Utilisable, mais l'attente réelle pourrait raisonnablement tomber n'importe où dans la plage.
Confiance faible
Intervalle de plus de 6 heures. L'attente de cet hôpital est trop variable ou trop différente de nos données d'entraînement pour donner une estimation ponctuelle utile. Nous affichons du langage qualitatif ("L'attente est imprévisible en ce moment") au lieu d'un chiffre précis.

Quand nous refusons de prédire

Certains hôpitaux sont trop différents de tout ce qui se trouve dans notre ensemble d'entraînement pour être prédits de manière fiable. Un petit hôpital éloigné peut n'avoir aucun analogue proche parmi les hôpitaux avec données en direct. Un nouvel établissement avec une structure contrairement à aucun informateur.

Pour ceux-ci, un classificateur séparé les signale comme "abstenus" et nous affichons les moyennes mensuelles historiques du SNISA à la place. Environ 17 % des hôpitaux silencieux tombent dans cette catégorie. Afficher des moyennes historiques n'est pas aussi bon qu'une estimation en direct, mais c'est mieux que de prétendre savoir quelque chose que nous ne savons pas.

Pourquoi les intervalles sont larges

Si vous regardez un hôpital silencieux et que la prédiction dit "souvent 2 à 5h, parfois plus long," c'est frustrant. Compréhensible. Voici pourquoi cela se produit :

Nous avons des informations limitées. Un hôpital silencieux, par définition, ne nous dit rien sur son état actuel. Nous savons que c'est un hôpital communautaire de 150 lits dans le sud-ouest de l'Ontario un mardi après-midi, mais nous ne savons pas s'il vient de recevoir un accident d'ambulance, s'il y a un changement de quart, ou si la salle d'attente est vide.

Les temps d'attente sont réellement variables. Même pour un seul hôpital, l'attente à 14h un mardi donné peut être de 45 minutes ou de 4 heures selon le mélange d'acuité, la dotation en personnel et des dizaines d'autres facteurs qu'aucun modèle ne peut voir.

L'honnêteté vaut mieux que la précision. Nous pourrions afficher un seul chiffre qui a l'air confiant en cachant simplement l'incertitude. D'autres services le font. Nous avons choisi de ne pas le faire, parce qu'un chiffre qui a l'air confiant mais qui est faux la moitié du temps est pire qu'une plage honnête.

La largeur de l'intervalle est une caractéristique, pas un défaut. Elle vous dit à quel point la prédiction devrait être fiable.

Comment les hôpitaux peuvent améliorer leurs prédictions

Les hôpitaux silencieux peuvent remplacer notre prédiction par leur propre temps d'attente en rapportant directement via le portail hôpital d'ERstat. Une seule mise à jour du personnel hospitalier — une infirmière-chef qui appuie sur un numéro sur un téléphone — remplace la prédiction par une valeur mesurée. Les mises à jour restent en direct pour une fenêtre configurable, puis la prédiction reprend le relais si aucune nouvelle mise à jour n'arrive.

En savoir plus sur le portail hôpital →

Ce que nous ne faisons pas

Nous ne prédisons pas pour les hôpitaux qui publient des données en direct. Si vous regardez un hôpital dont la province publie les temps d'attente, vous voyez leur chiffre réel — pas notre prédiction.

Nous ne faisons pas la moyenne des prédictions entre hôpitaux. Chaque hôpital silencieux obtient sa propre prédiction basée sur ses propres caractéristiques.

Nous ne partageons pas les observations individuelles d'attente. Les données des hôpitaux sont utilisées globalement pour entraîner le modèle. Nous ne republions pas d'informations identifiantes.

Nous ne prétendons pas remplacer le jugement clinique. Si vous ou quelqu'un que vous connaissez vit une urgence médicale, allez au service d'urgence le plus proche ou appelez le 911. Le temps d'attente n'est pas un indicateur de gravité. Les conditions potentiellement mortelles sont triées immédiatement à l'arrivée, peu importe l'attente rapportée.

Le volet technique

Pour les lecteurs qui veulent le détail d'ingénierie.

Modèle de base
Ensemble de régression quantile LightGBM, entraîné à prédire plusieurs quantiles (p10, p50, p90) simultanément
Transformation de la cible
log1p (prédictions faites en log-minutes, inversées pour l'affichage)
Caractéristiques
Structurelles, géographiques, groupe de pairs, temporelles, avec encodage de cible pour les catégorielles à haute cardinalité
Entraînement
Validation croisée par exclusion d'hôpitaux sur les hôpitaux informateurs pour générer des données de calibration honnêtes ; modèle final ajusté sur toutes les données disponibles
Méthode conforme
Prédiction conforme par scission Mondrian (stratifiée) avec des cellules (groupe-province × ruralité) ; couverture marginale cible de 80 %
Abstention
Classificateur de décalage de covariables entraîné à distinguer les distributions de caractéristiques des hôpitaux silencieux de celles des hôpitaux informateurs ; les hôpitaux au-dessus du seuil sont abstenus
Cadence de rafraîchissement
Cycles de prédiction de 15 minutes, ré-entraînement complet quotidien
Horizon
0 minute (estimation actuelle — reflète l'attente courante, pas une prévision future)
Seuils de confiance
Largeur d'intervalle < 180 min = élevée ; 180–360 min = modérée ; > 360 min = faible
Couverture atteinte sur informateurs retenus
~84 % (cible 80 %)
Taux d'abstention sur hôpitaux silencieux
~17 %
Version actuelle du modèle
v1.5

Questions ?

La méthodologie derrière ERstat est volontairement transparente parce que la prédiction de temps d'attente dans le secteur de la santé est trop importante pour être une boîte noire. Si vous êtes chercheur, clinicien ou administrateur d'hôpital et souhaitez approfondir, contactez-nous — nous répondrons à ce que nous pouvons.

Explorer ERstat

Voir tous les hôpitaux · Transparence par province · Pour les hôpitaux