La méthodologie complète, en langage clair
Résumé : Pour les hôpitaux qui ne publient pas leurs temps d'attente, nous estimons le temps d'attente probable en ce moment à partir des patrons observés dans les hôpitaux qui publient. Nous affichons une plage parce que l'attente réelle varie vraiment — la plage est réelle, ce n'est pas une échappatoire. Chaque estimation est mise à jour toutes les 15 minutes.
Hôpitaux avec données en direct. Certaines autorités provinciales publient les temps d'attente — Alberta Health Services, Nova Scotia Health, Index Santé du Québec, ED Wait Times de la C.-B., et d'autres. Pour ces hôpitaux, vous voyez le temps que leur propre système rapporte, avec un horodatage. Aucune prédiction n'a lieu ; c'est leur chiffre. Au total, cela couvre environ 200 services d'urgence au Canada.
Hôpitaux silencieux. La plupart des urgences canadiennes ne publient pas leurs temps d'attente. Pour eux, nous estimons à partir des patrons appris des hôpitaux qui publient. Sur 474 hôpitaux silencieux, environ 394 obtiennent une estimation à chaque cycle. Les 80 autres sont des cas où notre modèle ne peut rien dire d'utile avec confiance — nous les appelons "abstenus" et retombons sur les moyennes historiques.
La prédiction d'ERstat est une estimation actuelle — une estimation de ce à quoi ressemble l'attente en ce moment, pas ce qu'elle sera plus tard aujourd'hui. Nous comblons le vide pour les hôpitaux qui ne nous disent pas leur état actuel ; nous n'essayons pas de prédire les heures à venir. Quand vous voyez "~2h 15m attente typique," c'est notre meilleure estimation de l'attente à ce moment, mise à jour il y a au plus 15 minutes.
Nous utilisons une seule définition cohérente : le temps entre l'arrivée et la rencontre d'un médecin. Pas le temps de triage. Pas la durée totale de la visite. Pas le temps jusqu'à l'attribution d'un lit.
C'est important parce que différentes provinces mesurent différentes choses. Nous harmonisons tout en "temps jusqu'au médecin" parce que c'est la métrique qui compte le plus pour les patients et c'est ce que la plupart des sources provinciales rapportent. Certaines sources — par exemple le flux ArcGIS du Nouveau-Brunswick, qui rapporte la durée totale de la visite — sont exclues de l'entraînement parce que leurs chiffres fausseraient les prédictions.
Toutes les 15 minutes, nous enregistrons ce que les hôpitaux avec données en direct rapportent. Au fil du temps, cela devient un grand ensemble de données qui relie les caractéristiques observables d'un hôpital (taille, emplacement, type, heure du jour, jour de la semaine) aux temps d'attente réels.
Nous utilisons un ensemble de régression quantile LightGBM. En langage simple : c'est un modèle d'apprentissage automatique entraîné à prédire non pas une seule valeur attendue, mais une plage — une borne inférieure, une médiane, et une borne supérieure. Il apprend des patrons comme "les petits hôpitaux ruraux le dimanche matin ont généralement des attentes autour de X" à partir de dizaines de milliers d'observations réelles.
Les caractéristiques que nous lui fournissons incluent :
Notamment, nous n'utilisons aucune caractéristique sur l'état actuel de l'hôpital — nous ne pouvons pas, parce que par définition ce sont des hôpitaux silencieux qui ne nous disent pas leur état. C'est la limite fondamentale des prédictions pour les hôpitaux silencieux, et c'est pourquoi les intervalles sont aussi larges.
Le modèle brut nous donne une plage, mais les modèles d'apprentissage automatique tendent à être trop confiants dans leurs plages. Nous ajoutons donc une deuxième étape appelée prédiction conforme.
Nous retenons des données des hôpitaux avec données en direct et vérifions : quand le modèle dit "entre 2 et 5 heures," l'attente réelle tombe-t-elle dans cette plage 80 % du temps ? Sinon, nous élargissons la plage jusqu'à ce que ce soit le cas. Nous faisons cela séparément pour différents types d'hôpitaux (par région et ruralité) pour que l'élargissement reflète le patron d'erreur réel pour les hôpitaux similaires.
Résultat : quand nous disons que notre intervalle couvre 80 % des cas, cela signifie que l'attente réelle devrait tomber dans cette plage 80 fois sur 100. C'est une affirmation mathématiquement défendable, vérifiée sur des données réelles mises de côté, pas une intuition.
Chaque prédiction est accompagnée d'une étiquette de confiance, basée sur la largeur de l'intervalle :
Certains hôpitaux sont trop différents de tout ce qui se trouve dans notre ensemble d'entraînement pour être prédits de manière fiable. Un petit hôpital éloigné peut n'avoir aucun analogue proche parmi les hôpitaux avec données en direct. Un nouvel établissement avec une structure contrairement à aucun informateur.
Pour ceux-ci, un classificateur séparé les signale comme "abstenus" et nous affichons les moyennes mensuelles historiques du SNISA à la place. Environ 17 % des hôpitaux silencieux tombent dans cette catégorie. Afficher des moyennes historiques n'est pas aussi bon qu'une estimation en direct, mais c'est mieux que de prétendre savoir quelque chose que nous ne savons pas.
Si vous regardez un hôpital silencieux et que la prédiction dit "souvent 2 à 5h, parfois plus long," c'est frustrant. Compréhensible. Voici pourquoi cela se produit :
Nous avons des informations limitées. Un hôpital silencieux, par définition, ne nous dit rien sur son état actuel. Nous savons que c'est un hôpital communautaire de 150 lits dans le sud-ouest de l'Ontario un mardi après-midi, mais nous ne savons pas s'il vient de recevoir un accident d'ambulance, s'il y a un changement de quart, ou si la salle d'attente est vide.
Les temps d'attente sont réellement variables. Même pour un seul hôpital, l'attente à 14h un mardi donné peut être de 45 minutes ou de 4 heures selon le mélange d'acuité, la dotation en personnel et des dizaines d'autres facteurs qu'aucun modèle ne peut voir.
L'honnêteté vaut mieux que la précision. Nous pourrions afficher un seul chiffre qui a l'air confiant en cachant simplement l'incertitude. D'autres services le font. Nous avons choisi de ne pas le faire, parce qu'un chiffre qui a l'air confiant mais qui est faux la moitié du temps est pire qu'une plage honnête.
La largeur de l'intervalle est une caractéristique, pas un défaut. Elle vous dit à quel point la prédiction devrait être fiable.
Les hôpitaux silencieux peuvent remplacer notre prédiction par leur propre temps d'attente en rapportant directement via le portail hôpital d'ERstat. Une seule mise à jour du personnel hospitalier — une infirmière-chef qui appuie sur un numéro sur un téléphone — remplace la prédiction par une valeur mesurée. Les mises à jour restent en direct pour une fenêtre configurable, puis la prédiction reprend le relais si aucune nouvelle mise à jour n'arrive.
Nous ne prédisons pas pour les hôpitaux qui publient des données en direct. Si vous regardez un hôpital dont la province publie les temps d'attente, vous voyez leur chiffre réel — pas notre prédiction.
Nous ne faisons pas la moyenne des prédictions entre hôpitaux. Chaque hôpital silencieux obtient sa propre prédiction basée sur ses propres caractéristiques.
Nous ne partageons pas les observations individuelles d'attente. Les données des hôpitaux sont utilisées globalement pour entraîner le modèle. Nous ne republions pas d'informations identifiantes.
Nous ne prétendons pas remplacer le jugement clinique. Si vous ou quelqu'un que vous connaissez vit une urgence médicale, allez au service d'urgence le plus proche ou appelez le 911. Le temps d'attente n'est pas un indicateur de gravité. Les conditions potentiellement mortelles sont triées immédiatement à l'arrivée, peu importe l'attente rapportée.
Pour les lecteurs qui veulent le détail d'ingénierie.
La méthodologie derrière ERstat est volontairement transparente parce que la prédiction de temps d'attente dans le secteur de la santé est trop importante pour être une boîte noire. Si vous êtes chercheur, clinicien ou administrateur d'hôpital et souhaitez approfondir, contactez-nous — nous répondrons à ce que nous pouvons.
Voir tous les hôpitaux · Transparence par province · Pour les hôpitaux