La méthodologie complète, en langage clair
Résumé : Pour les hôpitaux qui ne publient pas leurs temps d'attente, nous estimons le temps d'attente probable en ce moment à partir des patrons observés dans les hôpitaux qui publient. Nous affichons une plage parce que l'attente réelle varie vraiment — la plage est réelle, ce n'est pas une échappatoire. Chaque estimation est mise à jour toutes les 15 minutes.
Hôpitaux avec données en direct. Certaines autorités provinciales publient les temps d'attente — Alberta Health Services, Nova Scotia Health, Index Santé du Québec, ED Wait Times de la C.-B., et d'autres. Pour ces hôpitaux, vous voyez le temps que leur propre système rapporte, avec un horodatage. Aucune prédiction n'a lieu ; c'est leur chiffre. Au total, cela couvre environ 200 services d'urgence au Canada.
Hôpitaux silencieux. La plupart des urgences canadiennes ne publient pas leurs temps d'attente. Pour eux, nous estimons à partir des patrons appris des hôpitaux qui publient. Sur 474 hôpitaux silencieux, environ 394 obtiennent une estimation à chaque cycle. Les 80 autres sont des cas où notre modèle ne peut rien dire d'utile avec confiance — nous les appelons "abstenus" et retombons sur les moyennes historiques.
La prédiction d'ERstat est une estimation actuelle — une estimation de ce à quoi ressemble l'attente en ce moment, pas ce qu'elle sera plus tard aujourd'hui. Nous comblons le vide pour les hôpitaux qui ne nous disent pas leur état actuel ; nous n'essayons pas de prédire les heures à venir. Quand vous voyez "~2h 15m attente typique," c'est notre meilleure estimation de l'attente à ce moment, mise à jour il y a au plus 15 minutes.
Nous utilisons une seule définition cohérente : le temps entre l'arrivée et la rencontre d'un médecin. Pas le temps de triage. Pas la durée totale de la visite. Pas le temps jusqu'à l'attribution d'un lit.
C'est important parce que différentes provinces mesurent différentes choses. Nous harmonisons tout en "temps jusqu'au médecin" parce que c'est la métrique qui compte le plus pour les patients et c'est ce que la plupart des sources provinciales rapportent. Certaines sources — par exemple le flux ArcGIS du Nouveau-Brunswick, qui rapporte la durée totale de la visite — sont exclues de l'entraînement parce que leurs chiffres fausseraient les prédictions.
Toutes les 15 minutes, nous enregistrons ce que les hôpitaux avec données en direct rapportent. Au fil du temps, cela devient un grand ensemble de données qui relie les caractéristiques observables d'un hôpital (taille, emplacement, type, heure du jour, jour de la semaine) aux temps d'attente réels.
Nous utilisons un ensemble de régression quantile LightGBM. En langage simple : c'est un modèle d'apprentissage automatique entraîné à prédire non pas une seule valeur attendue, mais une plage — une borne inférieure, une médiane, et une borne supérieure. Il apprend des patrons comme "les petits hôpitaux ruraux le dimanche matin ont généralement des attentes autour de X" à partir de dizaines de milliers d'observations réelles.
Les caractéristiques que nous lui fournissons incluent :
Notamment, nous n'utilisons aucune caractéristique sur l'état actuel de l'hôpital — nous ne pouvons pas, parce que par définition ce sont des hôpitaux silencieux qui ne nous disent pas leur état. C'est la limite fondamentale des prédictions pour les hôpitaux silencieux, et c'est pourquoi les intervalles sont aussi larges.
Le modèle brut nous donne une plage, mais les modèles d'apprentissage automatique tendent à être trop confiants dans leurs plages. Nous ajoutons donc une deuxième étape appelée prédiction conforme.
Nous retenons des données des hôpitaux avec données en direct et vérifions : quand le modèle dit "entre 2 et 5 heures," l'attente réelle tombe-t-elle dans cette plage 80 % du temps ? Sinon, nous élargissons la plage jusqu'à ce que ce soit le cas. Nous faisons cela séparément pour différents types d'hôpitaux (par région et ruralité) pour que l'élargissement reflète le patron d'erreur réel pour les hôpitaux similaires.
Pour les hôpitaux situés dans des régions où nous n'avons pas encore assez d'hôpitaux avec données en direct à proximité pour calibrer des prédictions spécifiques, le système se rabat sur un intervalle moyen national. Cela produit des estimations plus larges mais tout aussi honnêtes, plutôt que des intervalles étroits faussement confiants.
Résultat : quand nous disons que notre intervalle couvre 80 % des cas, cela signifie que l'attente réelle devrait tomber dans cette plage 80 fois sur 100. C'est une affirmation mathématiquement défendable, vérifiée sur des données réelles mises de côté, pas une intuition.
Lorsque vous arrivez sur la page d'un hôpital silencieux, la prédiction est présentée en trois lignes. Chacune joue un rôle distinct.
La plage principale est l'intervalle de planification — où l'attente réelle devrait se situer environ 80 % du temps. Nous l'affichons en premier parce que c'est ce sur quoi vous devriez planifier. Vous préparer pour la borne supérieure vous évite d'être pris au dépourvu si l'attente s'allonge.
« Le plus probable » est la médiane de la distribution prédite — le seul chiffre que le modèle considère le plus probable. Elle se trouve dans la plage principale et vous donne un point d'ancrage, mais ce n'est pas une promesse. Sur les hôpitaux où nous pouvons valider, la médiane est légèrement conservatrice : elle a tendance à surestimer l'attente réelle d'environ 13 minutes en moyenne. Nous préférons que vous planifiiez un peu plus de temps que pas assez.
« Habituellement X à Y à cet hôpital » est la plage des médianes que nous avons prédites pour cet hôpital au cours des sept derniers jours. Cela contextualise le chiffre d'aujourd'hui — s'il est normal pour cet hôpital ou inhabituel. Un hôpital dont la plage typique est 1h–2h est stable ; un hôpital dont la plage typique est 1h–5h varie beaucoup, et n'importe quelle prédiction peut atterrir n'importe où dans cette bande.
Nous affichons les trois plutôt qu'un seul chiffre parce que les attentes sont réellement incertaines. Une estimation qui paraît confiante mais qui se révèle erronée la moitié du temps laisse les gens avec le sentiment d'avoir été trompés lorsqu'ils attendent plus longtemps que prévu. Trois chiffres — une plage à planifier, un point d'ancrage le plus probable et un contexte propre à l'hôpital — vous permettent de prendre une vraie décision plutôt que d'accepter une seule fausse promesse.
Chaque prédiction est accompagnée d'une étiquette de confiance, basée sur la largeur de l'intervalle :
Certains hôpitaux sont trop différents de tout ce qui se trouve dans notre ensemble d'entraînement pour être prédits de manière fiable. Un petit hôpital éloigné peut n'avoir aucun analogue proche parmi les hôpitaux avec données en direct. Un nouvel établissement avec une structure contrairement à aucun informateur.
Pour ceux-ci, un classificateur séparé les signale comme "abstenus" et nous affichons les moyennes mensuelles historiques du SNISA à la place. Environ 17 % des hôpitaux silencieux tombent dans cette catégorie. Afficher des moyennes historiques n'est pas aussi bon qu'une estimation en direct, mais c'est mieux que de prétendre savoir quelque chose que nous ne savons pas.
Si vous regardez un hôpital silencieux et que la prédiction dit "souvent 2 à 5h, parfois plus long," c'est frustrant. Compréhensible. Voici pourquoi cela se produit :
Nous avons des informations limitées. Un hôpital silencieux, par définition, ne nous dit rien sur son état actuel. Nous savons que c'est un hôpital communautaire de 150 lits dans le sud-ouest de l'Ontario un mardi après-midi, mais nous ne savons pas s'il vient de recevoir un accident d'ambulance, s'il y a un changement de quart, ou si la salle d'attente est vide.
Les temps d'attente sont réellement variables. Même pour un seul hôpital, l'attente à 14h un mardi donné peut être de 45 minutes ou de 4 heures selon le mélange d'acuité, la dotation en personnel et des dizaines d'autres facteurs qu'aucun modèle ne peut voir.
L'honnêteté vaut mieux que la précision. Nous pourrions afficher un seul chiffre qui a l'air confiant en cachant simplement l'incertitude. D'autres services le font. Nous avons choisi de ne pas le faire, parce qu'un chiffre qui a l'air confiant mais qui est faux la moitié du temps est pire qu'une plage honnête.
La largeur de l'intervalle est une caractéristique, pas un défaut. Elle vous dit à quel point la prédiction devrait être fiable.
Les hôpitaux silencieux peuvent remplacer notre prédiction par leur propre temps d'attente en rapportant directement via le portail hôpital d'ERstat. Une seule mise à jour du personnel hospitalier — une infirmière-chef qui appuie sur un numéro sur un téléphone — remplace la prédiction par une valeur mesurée. Les mises à jour restent en direct pour une fenêtre configurable, puis la prédiction reprend le relais si aucune nouvelle mise à jour n'arrive.
Nous ne prédisons pas pour les hôpitaux qui publient des données en direct. Si vous regardez un hôpital dont la province publie les temps d'attente, vous voyez leur chiffre réel — pas notre prédiction.
Nous ne faisons pas la moyenne des prédictions entre hôpitaux. Chaque hôpital silencieux obtient sa propre prédiction basée sur ses propres caractéristiques.
Nous ne partageons pas les observations individuelles d'attente. Les données des hôpitaux sont utilisées globalement pour entraîner le modèle. Nous ne republions pas d'informations identifiantes.
Nous ne prétendons pas remplacer le jugement clinique. Si vous ou quelqu'un que vous connaissez vit une urgence médicale, allez au service d'urgence le plus proche ou appelez le 911. Le temps d'attente n'est pas un indicateur de gravité. Les conditions potentiellement mortelles sont triées immédiatement à l'arrivée, peu importe l'attente rapportée.
Pour les lecteurs qui veulent le détail d'ingénierie.
La méthodologie derrière ERstat est volontairement transparente parce que la prédiction de temps d'attente dans le secteur de la santé est trop importante pour être une boîte noire. Si vous êtes chercheur, clinicien ou administrateur d'hôpital et souhaitez approfondir, contactez-nous — nous répondrons à ce que nous pouvons.
Voir tous les hôpitaux · Transparence par province · Pour les hôpitaux