Comment ERstat prédit-il les temps d'attente aux urgences pour les hôpitaux qui ne publient pas de données ?

ERstat utilise un modèle d'apprentissage automatique (régression quantile LightGBM) entraîné à partir des patrons des hôpitaux canadiens qui publient leurs temps d'attente en direct. Le modèle apprend comment la taille de l'hôpital, l'emplacement, l'heure du jour et le jour de la semaine sont liés aux temps d'attente réels. Pour un hôpital silencieux, nous estimons le temps d'attente probable en ce moment à partir de ces patrons, avec un intervalle de confiance calibré sur des données réelles.

Pourquoi le temps d'attente prédit est-il affiché comme une plage plutôt qu'un seul chiffre ?

La plage montre l'incertitude réelle. Un seul chiffre qui a l'air confiant serait trompeur pour les hôpitaux silencieux, puisque nous n'avons aucune information sur leur état actuel. La plage est calibrée pour que l'attente réelle y tombe environ 80 % du temps.

À quelle fréquence les prédictions d'ERstat sont-elles mises à jour ?

Toutes les 15 minutes. Le modèle est ré-entraîné chaque nuit sur les données les plus récentes.

Pourquoi une prédiction d'ERstat affiche-t-elle trois chiffres différents ?

La plage principale est l'intervalle de planification de 80 % — où les attentes réelles devraient se situer 80 % du temps. « Le plus probable » est l'estimation centrale du modèle dans cette plage. « Habituellement X à Y à cet hôpital » montre la plage que nous avons prédite pour cet hôpital au cours de la dernière semaine, vous donnant un contexte pour savoir si le chiffre d'aujourd'hui est normal ou inhabituel.

Que signifie "confiance faible" sur une prédiction de temps d'attente ?

Confiance faible signifie que l'intervalle prédit est plus large que 6 heures — l'attente de cet hôpital est trop variable ou trop différente des hôpitaux de l'ensemble d'entraînement pour donner une estimation ponctuelle utile. Au lieu d'un chiffre précis, nous affichons du texte qualitatif comme "L'attente est imprévisible en ce moment" pour éviter la fausse précision.

Le personnel hospitalier peut-il mettre à jour ERstat directement au lieu d'utiliser les prédictions ?

Oui. Les hôpitaux peuvent s'abonner au portail hôpital d'ERstat, qui permet aux infirmières-chefs ou au personnel de rapporter les temps d'attente réels depuis n'importe quel téléphone. Les valeurs rapportées remplacent la prédiction immédiatement. Voir la page Pour les hôpitaux pour plus de détails.

ERstat

English

Comment ERstat prédit les temps d'attente

La méthodologie complète, en langage clair

Résumé : Pour les hôpitaux qui ne publient pas leurs temps d'attente, nous estimons le temps d'attente probable en ce moment à partir des patrons observés dans les hôpitaux qui publient. Nous affichons une plage parce que l'attente réelle varie vraiment — la plage est réelle, ce n'est pas une échappatoire. Chaque estimation est mise à jour toutes les 15 minutes.

Deux types d'hôpitaux

Hôpitaux avec données en direct. Certaines autorités provinciales publient les temps d'attente — Alberta Health Services, Nova Scotia Health, Index Santé du Québec, ED Wait Times de la C.-B., et d'autres. Pour ces hôpitaux, vous voyez le temps que leur propre système rapporte, avec un horodatage. Aucune prédiction n'a lieu ; c'est leur chiffre. Au total, cela couvre environ 200 services d'urgence au Canada.

Hôpitaux silencieux. La plupart des urgences canadiennes ne publient pas leurs temps d'attente. Pour eux, nous estimons à partir des patrons appris des hôpitaux qui publient. Sur 474 hôpitaux silencieux, environ 394 obtiennent une estimation à chaque cycle. Les 80 autres sont des cas où notre modèle ne peut rien dire d'utile avec confiance — nous les appelons "abstenus" et retombons sur les moyennes historiques.

Estimation actuelle, pas prévision future

La prédiction d'ERstat est une estimation actuelle — une estimation de ce à quoi ressemble l'attente en ce moment, pas ce qu'elle sera plus tard aujourd'hui. Nous comblons le vide pour les hôpitaux qui ne nous disent pas leur état actuel ; nous n'essayons pas de prédire les heures à venir. Quand vous voyez "~2h 15m attente typique," c'est notre meilleure estimation de l'attente à ce moment, mise à jour il y a au plus 15 minutes.

Ce que nous entendons par "temps d'attente"

Nous utilisons une seule définition cohérente : le temps entre l'arrivée et la rencontre d'un médecin. Pas le temps de triage. Pas la durée totale de la visite. Pas le temps jusqu'à l'attribution d'un lit.

C'est important parce que différentes provinces mesurent différentes choses. Nous harmonisons tout en "temps jusqu'au médecin" parce que c'est la métrique qui compte le plus pour les patients et c'est ce que la plupart des sources provinciales rapportent. Certaines sources — par exemple le flux ArcGIS du Nouveau-Brunswick, qui rapporte la durée totale de la visite — sont exclues de l'entraînement parce que leurs chiffres fausseraient les prédictions.

Comment fonctionne la prédiction

Les données d'entraînement

Toutes les 15 minutes, nous enregistrons ce que les hôpitaux avec données en direct rapportent. Au fil du temps, cela devient un grand ensemble de données qui relie les caractéristiques observables d'un hôpital (taille, emplacement, type, heure du jour, jour de la semaine) aux temps d'attente réels.

Le modèle

Nous utilisons un ensemble de régression quantile LightGBM. En langage simple : c'est un modèle d'apprentissage automatique entraîné à prédire non pas une seule valeur attendue, mais une plage — une borne inférieure, une médiane, et une borne supérieure. Il apprend des patrons comme "les petits hôpitaux ruraux le dimanche matin ont généralement des attentes autour de X" à partir de dizaines de milliers d'observations réelles.

Les caractéristiques que nous lui fournissons incluent :

Caractéristiques structurelles : population desservie, nombre de lits, s'il s'agit d'un hôpital d'enseignement, désignation de traumatologie
Géographie : province, ruralité
Groupement de pairs : hôpitaux similaires regroupés pour comparaison
Signaux temporels : heure de la semaine, encodée pour que le modèle apprenne les cycles quotidiens et hebdomadaires

Notamment, nous n'utilisons aucune caractéristique sur l'état actuel de l'hôpital — nous ne pouvons pas, parce que par définition ce sont des hôpitaux silencieux qui ne nous disent pas leur état. C'est la limite fondamentale des prédictions pour les hôpitaux silencieux, et c'est pourquoi les intervalles sont aussi larges.

Comment nous gérons l'incertitude honnêtement

Le modèle brut nous donne une plage, mais les modèles d'apprentissage automatique tendent à être trop confiants dans leurs plages. Nous ajoutons donc une deuxième étape appelée prédiction conforme.

Nous retenons des données des hôpitaux avec données en direct et vérifions : quand le modèle dit "entre 2 et 5 heures," l'attente réelle tombe-t-elle dans cette plage 80 % du temps ? Sinon, nous élargissons la plage jusqu'à ce que ce soit le cas. Nous faisons cela séparément pour différents types d'hôpitaux (par région et ruralité) pour que l'élargissement reflète le patron d'erreur réel pour les hôpitaux similaires.

Pour les hôpitaux situés dans des régions où nous n'avons pas encore assez d'hôpitaux avec données en direct à proximité pour calibrer des prédictions spécifiques, le système se rabat sur un intervalle moyen national. Cela produit des estimations plus larges mais tout aussi honnêtes, plutôt que des intervalles étroits faussement confiants.

Résultat : quand nous disons que notre intervalle couvre 80 % des cas, cela signifie que l'attente réelle devrait tomber dans cette plage 80 fois sur 100. C'est une affirmation mathématiquement défendable, vérifiée sur des données réelles mises de côté, pas une intuition.

Comment lire une prédiction

Lorsque vous arrivez sur la page d'un hôpital silencieux, la prédiction est présentée en trois lignes. Chacune joue un rôle distinct.

La plage principale est l'intervalle de planification — où l'attente réelle devrait se situer environ 80 % du temps. Nous l'affichons en premier parce que c'est ce sur quoi vous devriez planifier. Vous préparer pour la borne supérieure vous évite d'être pris au dépourvu si l'attente s'allonge.

« Le plus probable » est la médiane de la distribution prédite — le seul chiffre que le modèle considère le plus probable. Elle se trouve dans la plage principale et vous donne un point d'ancrage, mais ce n'est pas une promesse. Sur les hôpitaux où nous pouvons valider, la médiane est légèrement conservatrice : elle a tendance à surestimer l'attente réelle d'environ 13 minutes en moyenne. Nous préférons que vous planifiiez un peu plus de temps que pas assez.

« Habituellement X à Y à cet hôpital » est la plage des médianes que nous avons prédites pour cet hôpital au cours des sept derniers jours. Cela contextualise le chiffre d'aujourd'hui — s'il est normal pour cet hôpital ou inhabituel. Un hôpital dont la plage typique est 1h–2h est stable ; un hôpital dont la plage typique est 1h–5h varie beaucoup, et n'importe quelle prédiction peut atterrir n'importe où dans cette bande.

Nous affichons les trois plutôt qu'un seul chiffre parce que les attentes sont réellement incertaines. Une estimation qui paraît confiante mais qui se révèle erronée la moitié du temps laisse les gens avec le sentiment d'avoir été trompés lorsqu'ils attendent plus longtemps que prévu. Trois chiffres — une plage à planifier, un point d'ancrage le plus probable et un contexte propre à l'hôpital — vous permettent de prendre une vraie décision plutôt que d'accepter une seule fausse promesse.

Étiquettes de confiance

Chaque prédiction est accompagnée d'une étiquette de confiance, basée sur la largeur de l'intervalle :

Confiance élevée: Intervalle de moins de 3 heures. Le modèle est en terrain familier et la plage est assez étroite pour guider une décision.
Confiance modérée: Intervalle entre 3 et 6 heures. Utilisable, mais l'attente réelle pourrait raisonnablement tomber n'importe où dans la plage.
Confiance faible: Intervalle de plus de 6 heures. L'attente de cet hôpital est trop variable ou trop différente de nos données d'entraînement pour donner une estimation ponctuelle utile. Nous affichons du langage qualitatif ("L'attente est imprévisible en ce moment") au lieu d'un chiffre précis.

Quand nous refusons de prédire

Certains hôpitaux sont trop différents de tout ce qui se trouve dans notre ensemble d'entraînement pour être prédits de manière fiable. Un petit hôpital éloigné peut n'avoir aucun analogue proche parmi les hôpitaux avec données en direct. Un nouvel établissement avec une structure contrairement à aucun informateur.

Pour ceux-ci, un classificateur séparé les signale comme "abstenus" et nous affichons les moyennes mensuelles historiques du SNISA à la place. Environ 17 % des hôpitaux silencieux tombent dans cette catégorie. Afficher des moyennes historiques n'est pas aussi bon qu'une estimation en direct, mais c'est mieux que de prétendre savoir quelque chose que nous ne savons pas.

Pourquoi les intervalles sont larges

Si vous regardez un hôpital silencieux et que la prédiction dit "souvent 2 à 5h, parfois plus long," c'est frustrant. Compréhensible. Voici pourquoi cela se produit :

Nous avons des informations limitées. Un hôpital silencieux, par définition, ne nous dit rien sur son état actuel. Nous savons que c'est un hôpital communautaire de 150 lits dans le sud-ouest de l'Ontario un mardi après-midi, mais nous ne savons pas s'il vient de recevoir un accident d'ambulance, s'il y a un changement de quart, ou si la salle d'attente est vide.

Les temps d'attente sont réellement variables. Même pour un seul hôpital, l'attente à 14h un mardi donné peut être de 45 minutes ou de 4 heures selon le mélange d'acuité, la dotation en personnel et des dizaines d'autres facteurs qu'aucun modèle ne peut voir.

L'honnêteté vaut mieux que la précision. Nous pourrions afficher un seul chiffre qui a l'air confiant en cachant simplement l'incertitude. D'autres services le font. Nous avons choisi de ne pas le faire, parce qu'un chiffre qui a l'air confiant mais qui est faux la moitié du temps est pire qu'une plage honnête.

La largeur de l'intervalle est une caractéristique, pas un défaut. Elle vous dit à quel point la prédiction devrait être fiable.

Comment les hôpitaux peuvent améliorer leurs prédictions

Les hôpitaux silencieux peuvent remplacer notre prédiction par leur propre temps d'attente en rapportant directement via le portail hôpital d'ERstat. Une seule mise à jour du personnel hospitalier — une infirmière-chef qui appuie sur un numéro sur un téléphone — remplace la prédiction par une valeur mesurée. Les mises à jour restent en direct pour une fenêtre configurable, puis la prédiction reprend le relais si aucune nouvelle mise à jour n'arrive.

En savoir plus sur le portail hôpital →

Ce que nous ne faisons pas

Nous ne prédisons pas pour les hôpitaux qui publient des données en direct. Si vous regardez un hôpital dont la province publie les temps d'attente, vous voyez leur chiffre réel — pas notre prédiction.

Nous ne faisons pas la moyenne des prédictions entre hôpitaux. Chaque hôpital silencieux obtient sa propre prédiction basée sur ses propres caractéristiques.

Nous ne partageons pas les observations individuelles d'attente. Les données des hôpitaux sont utilisées globalement pour entraîner le modèle. Nous ne republions pas d'informations identifiantes.

Nous ne prétendons pas remplacer le jugement clinique. Si vous ou quelqu'un que vous connaissez vit une urgence médicale, allez au service d'urgence le plus proche ou appelez le 911. Le temps d'attente n'est pas un indicateur de gravité. Les conditions potentiellement mortelles sont triées immédiatement à l'arrivée, peu importe l'attente rapportée.

Le volet technique

Pour les lecteurs qui veulent le détail d'ingénierie.

Modèle de base: Ensemble de régression quantile LightGBM, entraîné à prédire plusieurs quantiles (p10, p50, p90) simultanément
Transformation de la cible: log1p (prédictions faites en log-minutes, inversées pour l'affichage)
Caractéristiques: Structurelles, géographiques, groupe de pairs, temporelles, avec encodage de cible pour les catégorielles à haute cardinalité
Entraînement: Validation croisée par exclusion d'hôpitaux sur les hôpitaux informateurs pour générer des données de calibration honnêtes ; modèle final ajusté sur toutes les données disponibles
Méthode conforme: Prédiction conforme par division stratifiée (Mondrian) avec cellules (groupe-province × ruralité). Les cellules comptant moins de 5 hôpitaux de calibration distincts utilisent l'élargissement global, garantissant des intervalles stables même là où la couverture des hôpitaux informateurs est limitée. Couverture marginale cible de 80 %.
Abstention: Classificateur de décalage de covariables entraîné à distinguer les distributions de caractéristiques des hôpitaux silencieux de celles des hôpitaux informateurs ; les hôpitaux au-dessus du seuil sont abstenus
Cadence de rafraîchissement: Cycles de prédiction de 15 minutes, ré-entraînement complet quotidien
Horizon: 0 minute (estimation actuelle — reflète l'attente courante, pas une prévision future)
Seuils de confiance: Largeur d'intervalle < 180 min = élevée ; 180–360 min = modérée ; > 360 min = faible
Couverture atteinte sur informateurs retenus: ~83 % (cible 80 %)
Taux d'abstention sur hôpitaux silencieux: ~17 %
Version actuelle du modèle: v1.5

Questions ?

La méthodologie derrière ERstat est volontairement transparente parce que la prédiction de temps d'attente dans le secteur de la santé est trop importante pour être une boîte noire. Si vous êtes chercheur, clinicien ou administrateur d'hôpital et souhaitez approfondir, contactez-nous — nous répondrons à ce que nous pouvons.

Explorer ERstat

Voir tous les hôpitaux · Transparence par province · Pour les hôpitaux