Hôpital sous tension, intelligence artificielle ou humaine ?
Confrontés à l’épidémie de Covid-19, les hôpitaux ont dû traiter dans l’urgence un gigantesque flux de données : nombre de malades, personnes hospitalisées, décès, indicateurs sur les médicaments etc. Des informaticiens, des médecins, des chercheurs de l’APHP et de l’Inria se sont alliés pour créer des outils de gestion de ces données, afin de mieux comprendre cette maladie et mieux la prendre en charge.
Un épisode de la série « Virus connexion »
Réalisation : François Demerliac
Production : Virtuel, en partenariat avec Universcience et l'IRD
Année de production : 2020
Durée : 10min30
Accessibilité : sous-titres français
Hôpital sous tension, intelligence artificielle ou humaine ?
En Ile-de-France, au début de l'épidémie de Covid-19, les hôpitaux ont dû réagir immédiatement. "On a été vite confronté à un besoin de remonter l'information, à la fois pour le pilotage de la crise de manière opérationnelle dans nos hôpitaux mais aussi par rapport au suivi d'épidémies à l'échelle nationale, donc savoir combien de patients étaient atteints du coronavirus en Ile-de-France, à l'AP-HP savoir combien mouraient tous les jours, comprendre quels étaient les patients qui finissaient en réanimation, comment est-ce qu'ils étaient pris en charge, est-ce qu'on avait les indicateurs précoces de médicaments qui pouvaient fonctionner, et c'est comme ça qu'on a été amené à travailler en très étroite collaboration avec l'équipe Parietal de l'Inria et d'autre équipes de l'Inria et donc Alexandre Gramfort." "Mon équipe, moi-même et un certain nombre de chercheurs de l'équipe Parietal Inria dans sa globalité , sont venus prêter main forte à l'équipe d'Elisa, pour aider à la structuration des données, à aider dans cette remise de remontée d'informations quotidiennes." "L'AP-HP avait déjà initié une démarche il y a plusieurs années. On a commencé en 2015 à vraiment construire un entrepôt de données de santé, donc une sorte de grande base de données qui rassemble les données cliniques des patients qui passent dans nos hôpitaux, pour d'autres finalités que celle du soin, donc la recherche principalement, le pilotage de l'activité hospitalière et l'innovation. Donc on a pu s'appuyer sur cette initiative qui était déjà bien engagée pour constituer cette base de données qu'on a appelé "Entrepôt de données de santé Covid" ou EDS Covid." "Là, l'EDS nous a donné une plateforme assez unique et avec les outils qu'on avait l'habitude d'utiliser, du Python, des logiciels open source, des bases de données structurées sur lesquelles on a pu très rapidement être opérationnel, sans être sur place, en travaillant dans une interface de programmation dans un navigateur." La difficulté était de gérer de plus en plus de données avec de plus en plus de complexité et toujours dans l'urgence. "En terme quantitatif, aujourd'hui, l'Entrepôt de données de santé de l'AP-HP, c'est les données d'environ 13 millions de patients. 13 millions de patients, c'est plus de 50 ou 60 millions de comptes-rendus médicaux, de textes médicaux, des milliards de résultats de biologie, des millions d'examens d'imagerie, etc. Pour avoir les données presque en temps réel, et après, une fois qu'on a identifié ces patients-là, avec le résultat de biologie, récupérer toutes les informations qu'on avait à disposition sur eux. Pour certains patients qui étaient pris en charge à l'AP-HP, on pouvait avoir un historique médical de plusieurs années." "Très vite, on a vu les faits, par exemple, que les hommes étaient plus touchés que les femmes, on pouvait regarder les corrélations entre les indices de masse corporelle, on pouvait regarder les corrélations par rapport aux antériorités de prise de certains médicaments. Voilà, le fait d'avoir, pas juste la PCR, mais aussi le parcours patient avec Orbis nous permettait d'avoir des informations qui étaient extrêmement potentiellement très fines. Quand on a commencé, on avait quelques milliers de tests PCR dans la base, donc on avait quelques milliers de patients à traiter. A la fin de la première la première vague, on avait plus de cent mille patients dans la base de données, donc même les outils logiciels qu'on développait marchaient très bien avec quelques milliers de patients et puis tous les jours il y en avait plus, donc les traitements prenaient de plus en plus de temps mais on avait toujours que 24 heures pour traiter les données. Donc il fallait être aussi agile dans les outils algorithmiques qu'on mettait en place pour être toujours capable de répondre à la demande quotidienne en un temps raisonnable." "Maintenant, les questions qui se posent, c'est quel variant du virus a-t-on, quels sont les clusters qu'on va avoir à l'AP-HP par rapport à ces nouveaux variants. Donc ce sont des questions qui arrivent et qui sont à prendre en compte." "J'imagine tout de suite qu'il va falloir rajouter une colonne dans la base de données qui dit quel variant c'est, et là, j'imagine tout de suite tous les problèmes informatiques qui arrivent quand on change les schémas de données. Ca casse les briques logicielles qui existent, il faut les réparer aussi vite qu'on les casse, c'est vraiment toute la difficulté et c'est pour ça qu'il faut être hyper agile sur les outils logiciels qui permettent de faire ça." Mais est-ce que ce n'est pas justement là que l'intelligence artificielle peut être utile ? "Je sais qu'on parle beaucoup d'intelligence artificielle de nos jours. Donc moi, j'ai un point de vue "recherche", ce que je fait, c'est ce que l'on appellerait aussi de l'apprentissage statistique, du machine learning, qui est une discipline de l'intelligence artificielle. Mais c'est vrai que le traitement des données de santé passe aussi à travers de la saisie. Les saisies qui sont faites par des personnes différentes avec des cultures différentes, avec des contraintes opérationnelles et des contraintes au quotidien qui sont importantes, qui fait que les données sont collectées aussi, je dirais le mieux possible, mais c'est jamais parfait. Un certificat de décès qui est émis le dimanche, mais le dernier événement de biologie est finalement rentré dans la base de données le lundi, et on se retrouve avec des gens qui ont des événements médicaux qui sont le lendemain leur date de décès. Donc c'est des choses, quand vous programmez votre logiciel pour gérer ça, vous n'imaginez même pas que ça puisse arriver, sauf que la réalité des données fait que ça se passe comme ça et il y a des bonnes raisons pour lesquelles ça se passe comme ça. Si vous avez un programme qui considère qu'il ne peut pas y avoir d'événement biologie après le décès, le truc casse." "C'était plutôt du coup mon équipe qui était focalisée sur ces aspects-là. Je ne sais pas si c'est intelligence artificielle ou intelligence humaine, mais on n'aurait pas réussi à faire tout ça si on n'avait pas eu des médecins qui étaient complètement impliqués dans toute cette analyse de données, donc il y a eu quand même pas mal de médecins qui sont venus travailler à nos côtés. Sinon, on n'aurait pas réussi." "On a tous notre jargon professionnel, et donc là, il a fallu comprendre tous les acronymes comprendre les différents types de services hospitaliers. Il y avait un certain nombre d'informations qui étaient peut-être complètement évidentes pour un médecin, mais pour nous qui ne l'était pas. et donc ça nous a amené à faire des contresens. Tous les jours, il y avait un cas auquel on n'avait pas pensé qu'il fallait intégrer et gérer dans le traitement de données. Sinon, on avait des valeurs aberrantes. Il suffit qu'il y ait un patient qui soit hospitalisé depuis deux ans avec un dossier ouvert à l'AP-HP pour que la durée d'hospitalisation moyenne, surtout au début, augmente de plusieurs jours." "C'est quand même important de combiner la partie machine learning traitement de données avec la réalité de la pathologie et des prises en charge." Et comment connecter humains et digital ? "On est une équipe qui fait beaucoup de logiciels open source, donc le cadre de notre projet, au niveau de Parietal, s'appelait ScikitEDS. Scikit learn est un projet logiciel qui fait du machine learning qui est développé historiquement au sein de l'équipe Parietal pour travailler en commun. Quand on a dix personnes qui travaillent 15 heures par jour sur le même code sans être complètement en train de se parler en permanence, la probabilité que les gens cassent ou tirent un peu la couverture dans une sens opposé des autres, c'est mécanique que ça arrive, et bien voilà c'est cet aspect-là qu'on a mis en place, histoire que, quand on corrigeait un problème, on n'en créait pas deux." Une autre difficulté est qu'il s'agit de données sensibles. "Nous, on a pu s'appuyer sur le travail un peu de fond qui avait été fait sur la mise en place de l'Entrepôt de données de santé, où on avait déjà la base de données des dispositifs qui permettait de pseudonomiser les données." "Avec un serveur VPN qui nous permet de travailler avec une connexion cryptée de chez nous de travailler sur les bases donc pseudo-anonymisées. En tout cas, si on avait dû se déplacer physiquement sur place à la DSI de l'AP-HP pour travailler, je pense que ça aurait été très compliqué." Beaucoup de personnes ont été mobilisées. "On est arrivé peut-être à 40, 50 personnes de l'AP-HP qui travaillaient sur le sujet et puis on a eu quasiment 100 bénévoles qui sont venus nous aider à une mobilisation que je trouve assez colossale d'appuis extérieurs. On a eu des appuis d'entreprises extérieures qui ont soit mis à disposition des ressources, soit mis à disposition des personnels. C'était beaucoup beaucoup de solidarité. Je trouve en tout cas à notre niveau, ce qui a été un défi, ça a été d'être en capacité d'accueillir... ce n'était pas forcément évident." "Au début, nous on a un peu essuyé les plâtres sur tout et globalement on a réussi à trouver le point intermédiaire entre nos exigences pour travailler le plus efficacement possible par rapport à nos outils à nous et ce qui était concrètement faisable avec les ressources humaines." Et au-delà de cette épidémie, à quoi aura servi tout ce travail ? "Pour nous, cela a été un énorme accélérateur, à la fois parce qu'il y a à peu près 60 projets de recherche qui sont lancés sur cette base-là et que, du coup, des chercheurs qui voient un peu la manière d'aborder ces données de santé cliniques, ça leur permet derrière d'étudier : "tiens, moi, je vais regarder finalement qu'est-ce qui s'est passé avec le cancer et les gens atteints de covid", et les usages, même les des outils qu'on a développé et puis les collaborations qu'on est en capacité de mener maintenant." "Un doctorant qui travaille sur un projet de recherche, c'est un projet de six mois à un an, donc on a des livrables vraiment à long terme, c'est vraiment la temporalité de la recherche, et là, on s'est retrouvé dans un contexte où le livrable, c'était le lendemain. Donc pour nous, c'était une vie un peu différente mais qui était en même temps ultra stimulante. C'était sympa de se dire : "il faut casser ce problème pour demain" et puis tous les jours, il y avait un nouveau problème. Et puis on travaillait aussi entre copains, entre nous, en mode commando tous ensemble, en se serrant les coudes, pour moi c'était une belle expérience à titre perso." "C'était une période à la fois très intense mais aussi très gratifiante parce que finalement, tout le travail qu'on fait, on voit bien qu'il a une utilité forte, et que ça a du sens pour la prise en charge des patients." "On avait l'impression vraiment de servir à quelque chose".
Réalisation : François Demerliac
Production : Virtuel, en partenariat avec Universcience et l'IRD
Année de production : 2020
Durée : 10min30
Accessibilité : sous-titres français