E-santé : comment la maîtrise des données contribue à révolutionner la santé
Dans un secteur de la santé en pleine révolution, la maîtrise des données est devenue l’enjeu central pour de nombreux acteurs.
En effet, c’est grâce au traitement de la donnée que la médecine a pu réaliser ses avancées les plus spectaculaires au cours des dernières décennies. Le premier séquençage d’ADN humain ne date que de 1977. Il a fallu attendre 2003 pour que s’achève le premier projet de séquençage de génome humain.
En 20 ans, la maîtrise des données et les capacités de calcul ont largement explosé. Il y a quelques années encore, le séquençage du génome humain était encore très chronophage et très coûteux. Les progrès exponentiels de la bio-informatique permettent de changer d’échelle et ouvrent la porte à l’avènement d’une médecine personnalisée.
A quels grands enjeux de santé la maîtrise de données répond-elle ? Quels sont les défis auxquels les acteurs de l’écosystème font face et comment la solution Loamics contribue-t-elle à les relever ?
Le contexte : d’une médecine standardisée à une médecine personnalisée
Une révolution en marche
Le secteur de la santé connaît en ce moment une véritable révolution : le passage d’une médecine standardisée à une médecine personnalisée.
Jusqu’ici, la médecine est largement standardisée. Les patients qui présentent une même pathologie reçoivent tous le même traitement. Ensuite, selon leur réaction au traitement, ils se scindent en 3 groupes :
- Le premier groupe réagit positivement au traitement. La pathologie se résorbe.
- Sur le deuxième groupe, le traitement est sans effet.
- Enfin, pour le dernier groupe de patients, le traitement a des effets négatifs et l’état de santé s’aggrave.
Dans cette conception de la médecine, on considère la pathologie mais sans prendre en compte l’environnement au sein duquel elle se développe, c’est-à-dire les caractéristiques individuelles du patient.
Désormais, les progrès réalisés dans le séquençage du génome du patient permettent d’identifier les gènes qui prédisposent à une maladie, et même d’établir le profil génétique de cellules cancéreuses. En formulant un diagnostic sur plusieurs biomarqueurs, on peut alors segmenter les patients en plusieurs groupes qui recevront chacun un traitement adapté à leur diagnostic.
Puisque le traitement est adapté aux spécificités du patient, les chances de guérison sont plus importantes. C’est ce qu’on appelle la médecine personnalisée. Dans cette nouvelle logique, les médecins ne traitent plus une pathologie mais contextualisent le traitement en fonction des données multiples qu’ils ont pu recueillir et analyser.
Les données au cœur de la médecine personnalisée
La médecine personnalisée repose sur la capacité des acteurs de la e-santé à recueillir, centraliser, traiter et analyser des données biologiques issues de sources diverses. Dans cette optique, le séquençage du génome et du métagénome devient une discipline majeure.
En effet, personnaliser les diagnostics et les traitements nécessite l’intégration de « multi-omiques » à grande échelle :
- Génomique
- Transcriptomique
- Protéomique
- Métabolomique
Outre le séquençage du génome, la médecine personnalisée nécessite de traiter des données massives sur d’autres variables de l’écosystème. La connaissance du système microbiome est notamment cruciale car il impacte directement l’efficacité du traitement.
Or, dans le corps humain, 10 puissance 16 bactéries cohabitent pour créer un système stable. Si on veut connaître précisément leurs composantes et leurs interactions, les volumes de données sont immenses. Par conséquent, les entreprises biotech ont besoin de capacités de calcul importantes.
La médecine personnalisée implique donc des techniques de séquençage à haut débit permettant une meilleure description de la diversité microbienne et des fonctions biologiques potentielles par l’ensemble de la communauté.
E-santé et data : quels enjeux pour les acteurs ?
L’augmentation exponentielle des données de santé
Le déploiement des nouvelles technologies, depuis les années 2000, a entraîné une hausse exponentielle du volume de données de santé. A l’échelle globale, le volume total des données d'e-santé double tous les 73 jours !
Internet d’abord, les réseaux sociaux, le Cloud Computing ont facilité la génération et le partage d’informations. Le développement des objets connectés favorise la génération de données de santé recueillies directement auprès de l’utilisateur. Le déploiement de la 5G amplifiera encore cette massification des données.
Les praticiens et les établissements de santé génèrent également de larges sets de données : résultats patients, données des essais cliniques, données génétiques, données biocliniques, données pathologiques, prescriptions de pharmacie, résultats de laboratoires…
Quels usages pour les données de santé ?
La génération massive de données de santé est une réalité.
L’un des enjeux de la e-santé est justement d’acquérir une réelle maîtrise de la donnée pour en tirer des cas d’usage bénéfiques pour les médecins et la population :
- Aide au diagnostic
- Médecine personnalisée
- Bases de connaissance partagées
Les parties prenantes intéressées par la e-santé sont donc multiples : médecins et établissements de santé, patients, collectivité (dans une logique de veille sanitaire et de politiques publiques de santé), établissements de recherche, entreprises biotech…
Les challenges liés aux données
La data ouvre des perspectives pour des cas d’usage innovants en matière de santé. Mais la masse de données hétérogènes à gérer soulève aussi de nouveaux défis :
- Le stockage des données : collecter et centraliser des données de santé à grande échelle requiert des capacités de stockage conséquentes. Il faut être en mesure de stocker et intégrer n’importe quel type de données nécessaires.
- Le temps de calcul : les données recueillies sont hétérogènes. En l’état, elles ne peuvent pas immédiatement être exploitées dans le cadre d’une analyse. Le deuxième challenge consiste donc à homogénéiser les données pour les rendre exploitables dans des cas d’usage.
Par exemple, il y a encore quelques années, le séquençage du génome était très chronophage et un séquençage se chiffrait en milliards d’euros. Aujourd’hui, on peut séquencer 4 à 10 génomes en une journée pour un coût unitaire avoisinant les 1000 €. Tout simplement parce que les outils existent pour collecter les données, les homogénéiser, contrôler leur qualité et automatiser les workflows de machine learning et d’intelligence artificielle.
Une grande partie du travail de « nettoyage » de la donnée dont le data scientist devait s’acquitter est désormais automatisé. Il peut donc se concentrer sur des tâches à forte valeur ajoutée comme le développement de nouveaux algorithmes et l’interprétation des données.
La collecte, le contrôle de la qualité des données, la standardisation et la normalisation de la data et les workflows deviennent des « tâches d’arrière-plan ». Elles se font dans des délais beaucoup plus courts et à moindre coût. Les effets sont multiples : accélérer la découverte et la description d’une nouvelle pathologie ou encore accélérer la mise sur la marché d’un nouveau traitement…
Comment la solution Loamics repond-elle aux défis des acteurs de la e-santé ?
Loamics, une solution horizontale pour une maîtrise optimale des données
Loamics est une solution horizontale qui accompagne les acteurs de santé dans leur volonté de mieux maîtriser les données en vue de développer des applications-métiers data-based.
La solution s’articule autour de 3 grandes briques :
- Data Collect : la solution collecte des données massives et hétérogènes, quels que soient le type de données et leur source. Par exemple, pour les laboratoires qui travaillent sur la santé, les données peuvent être des biomarqueurs, les données du microbiote ou les données de séquençage massif.
- Data Lake : Loamics centralise les données dans un même entrepôt de données, mais surtout la solution rend les données exploitables. Elle homogénéise les données pour les rendre utilisables dans les prises de décision ou dans le développement d’applications métiers.
- Algorithms : Loamics permet d’automatiser facilement des scénarios d’algorithmes de machine learning ou d’intelligence artificielle sur des données préalablement nettoyées et fiabilisées.
Grâce à ces 3 briques, la solution accélère considérablement la transformation digitale du secteur biotech. Auparavant, le contrôle des données et la validation des protocoles prenaient énormément de temps. Cette partie est désormais automatisée pour isoler rapidement un échantillon de bonne qualité.
En définitive, Loamics répond au triple défi du stockage des données, de l’homogénéisation et du temps de calcul.
Une architecture data qui ouvre la voie à des usages diversifiés
Loamics libère les équipes du travail sur le nettoyage de la donnée et leur permet de se concentrer sur l’interprétation des analyses et le design de nouvelles solutions.
Les cas d’usage sont multiples :
- Analyses personnalisées en partenariat avec des acteurs de l’écosystème : la solution logicielle Loamics soutient l’innovation, aboutissant au dépôt de brevets combinés, par exemple avec des entreprises biotech.
- Analyse des données publiques existantes : Loamics permet la mise en réseau des données de santé pour une meilleure collaboration internationale entre les acteurs. Nous développons une base de données de santé en réseau sous forme de DataMart.
- Aide au diagnostic : l’ouverture des données médicales en France favorise la mise en réseau des informations. Avec Loamics, il est possible d’importer des données textuelles issues des dossiers médicaux et de les traiter avec un algorithme IA pour extraire les règles médicales et faciliter le diagnostic par comparaison à une ontologie.
L’explosion de la data est en passe de révolutionner la médecine. Mais, pour cela, encore faut-il que les professionnels du secteur gagnent en maîtrise des données.
Stockage des données, homogénéisation, temps de calcul, la solution Loamics contribue aux innovations de santé en fournissant aux acteurs une architecture pour automatiser une partie du parcours de la donnée et accélérer le développement des applications métiers.