Le laboratoire LIM&BIO créé et implanté en 2022 sur le campus de Bobigny résulte de la volonté de l’Université Paris 13 de favoriser l’émergence d’un centre de recherche innovant en Informatique Médicale et Bioinformatique.
Les activités du LIM&BIO visent à developper:
La conception et l’évaluation de nouvelles méthodes et outils de diffusion des connaissances médicales (systèmes décisionnels) à destination des médecins, paramédicaux et patients.
La conception et la mise en oeuvre de méthodes et d’algorithmes issues de l’IA pour l’extraction de connaissances à partir de données biopuces et cliniques et leur évaluation statistique.
Le LIM&BIO est à l’origine de l’EPML-CNRS 32 dénommée IAPuces, une équipe-projet multi-laboratoires STIC-CNRS qui regroupe des chercheurs des universités Paris 13 et Paris 6 (L’équipe EA3502 de l’Hotel-Dieu).
Préinscriptions au Master d’Informatique Biomédicale 2026-2027.
Contact: Prof. Alain Venot
Directeur : Alain Venot, Professeur de Biostatistique, Informatique Médicale et Technologies de la Communication-Praticien Hospitalier
Co-Directeur : Jean-Daniel Zucker, Professeur des Universités, Informatique
Composante de rattachement : UFR SMBH
Les activités du LIM&BIO visent à developper
Deux principales thématiques complémentaires sont abordées au LIM&BIO:
Le fonctionnement des systèmes d’aide à la décision en santé repose sur des bases de connaissances et la prise en compte de données du patient et éventuellement d’autres acteurs. La construction de bases de connaissances résulte de plusieurs étapes pour lesquelles nous essayons de faire progresser la méthodologie. Il est primordial de concevoir des méthodes destinées à l’exploration du contenu de corpus de textes médicaux écrits en langage naturel éventuellement très volumineux comme par exemple l’ensemble des résumés des caractéristiques produits des médicaments. Des méthodes de représentation et de codage de ces connaissances doivent être conçues pour en permettre une utilisation conjointe avec les données du patient exprimées en langage naturel ou représentées et codées à l’aide des grandes classification et systèmes terminologiques. Enfin la constitution et la maintenance de ces bases peut être grandement facilitée par la mise au point de méthodes d’extraction automatique de ces connaissances.
Les données du patient telles que celles stockées dans les dossiers informatisés doivent pouvoir être saisies de manière ergonomique et représentées et codées avec un niveau de granularité et d’abstraction de l’information adapté aux fonctionnalités recherchées dans les systèmes d’aide à la décision. La mise au point de méthode permettant l’exploitation des données saisies en langage naturel par le médecin représente aussi un enjeu important.
Projets associés : ASTI, P2VIE, R2CP
La capacité à adapter sa représentation en fonction de la tâche à résoudre —reconnue comme étant au cœur de l’intelligence humaine— est l’un des problèmes fondamentaux de l’Intelligence Artificielle. Cette capacité est essentielle tant pour réduire la complexité algorithmique que pour permettre aux systèmes de se focaliser sur les informations pertinentes. L’approche générale sur laquelle nous nous basons consiste à combiner abstractions (changement de la granularité des connaissances dans un même formalisme) et reformulation (changement de formalisme de représentation). En apprentissage automatique, il existe aujourd’hui une large panoplie d’algorithmes permettant d’apprendre des hypothèses dans des langages plus ou moins expressifs avec des complexités qui peuvent atteindre la linéarité avec le nombre d’exemples et plus faible que quadratique avec le nombre d’attributs. Un des enjeux de l’apprentissage sur lequel nous nous penchons est celui de l’apprentissage à partir de peu d’exemples et de nombreux attributs, cas typiquement rencontré dans le traitement des puces à ADN. Nous avons utilisé les changements de représentations avec un relatif succès dans plusieurs tâches d’apprentissage dans les domaines de : la généralisation cartographique, l’apprentissage situé de l’ancrage dans un robot autonome, l’apprentissage non-supervisé de caractères chinois, l’analyse de profils d’expressions de gènes impliqués dans l’obésité, l’aide à la découverte en physique granulaire, etc.
Aujourd’hui les axes de cette thématique s’articulent autour de:
Les principaux projets menés au LIM&BIO détaillés plus bas sont:
R2CP (Représentation des Résumés des Caractéristiques Produits des Médicaments)
ASTI (Aide à la Stratégie Thérapeutique Informatisée)
P2VIE (Prévention et Prise en charge du Vieillissement et Information Electronique)
IAPuces (Equipe-Projet Multi-Laboratoires Paris 6/Paris13)
ObeChips(cadre: Projet CNRS theme: Plateforme logiciel/Sélection d’attributs)
MaGO (cadre: Projet INSERM theme: Classification Automat. de Donneées BioPuces basée sur GO)
ObeLinks (cadre: Award Fond Berkeley France Funds)
PRA-SI02-07 (Projet Franco-Chinois)
COFECUB SMARTES (Projet Franco-Brésilien)
MISE-EN-SCENES (Projet ROBEA-STIC-CNRS)
Collaborations (projets non institutionnels) avec:
Equipe Apprentissage (Lorenza Saitta & Attilio Giordana)
Equipe “Généralisation Cartographique” (Sébastien Mustiere & Anne Ruas))
Equipe E3N de l’IGR (Stéphane Ragusa & François Clavel E3N)
Equipe Expertise, Mémoire et Motivation (Hubert Ripoll, J. Baratgin, S. MAvromatis)
Equipe INRIA de Jérome Euzenat
R2CP (Représentation des Résumés des Caractéristiques Produits des Médicaments)
Les Résumés des Caractéristiques Produits (RCP) des spécialités pharmaceutiques commercialisées en France (Plus de 4500), représentent un vaste corpus de textes diffusés par l’Agence Française de Sécurité Sanitaire des Produits de Santé (AFSSAPS). Ils décrivent les propriétés des médicaments comme leurs indications, contre-indications, pharmacocinétique, pharmacodynamie, précautions d’emploi, posologie recommandée. Ils sont écrits en langage naturel, le vocabulaire utilisé étant très contrôlé au moment de leur écriture. Leur représentation structurée est susceptible de conduire à des utilisations inaccessibles actuellement. Le LIM&BIO mène une recherche visant à modéliser le contenu de certaines rubriques de ces RCP à partir d’une méthodologie dérivée de méthodes de traitement automatique du langage et plus généralement de l’ingénierie des connaissances. L’objectif est de développer des outils utilisables pour l’aide à la prescription et au raisonnement médical, l’aide à la stratégie de développement de nouvelles molécules, l’aide à la rédaction des RCP, l’amélioration des bases médicaments et une facilitation de leur constitution et maintenance par des outils d’extraction automatique.
ASTI (Aide à la Stratégie Thérapeutique Informatisée)
Ce projet a pour objectif le développement de méthodes et outils logiciels destinés à aider le médecin dans le choix des meilleures thérapeutiques médicamenteuses adaptées au cas d’un patient donné. Il pose le problème de la représentation des connaissances sur les stratégies thérapeutiques telles que décrites dans les guides de bonnes pratiques cliniques et de la conception de moteurs d’inférences génériques pour l’utilisation de ces connaissances. Une première phase (1999-2022) soutenue financièrement par le Ministère de la Recherche et de la Technologie et coordonnée par A. Venot, a conduit à la conception d’un système illustré par un logiciel prototype développé dans le domaine du traitement médicamenteux de l’hypertension artérielle essentielle de l’adulte. Ces travaux ont été réalisés par un consortium comprenant quatre laboratoires d’informatique Médicale, deux industriels et la Société de Formation Thérapeutique du Généraliste. Une étude d’acceptabilité a été conduite en Médecine générale. L’extension d’ASTI a d’autres domaines, son amélioration pour le cas spécifique des maladies chroniques et une étude d’impact sont en projet. La valorisation d’ASTI doit conduire à la diffusion industrielle de bases de connaissances de stratégies thérapeutiques et d’outils d’aide à la prescription interfaçables facilement avec les logiciels de gestion de cabinet médical.
P2VIE (Prévention et Prise en charge du Vieillissement et Information Electronique)
Ce projet labellisé et financé par le Réseau National Technologie pour la Santé en 2020, veut utiliser les nouvelles technologies de l’information pour principalement (i) réaliser un serveur capable de présenter au senior des informations adaptées à son propre cas sur les pathologies liées au vieillissement pour lesquelles une prévention existe, (ii) développer un serveur médico-administratif pour faciliter le prise en charge de la dépendance, (iii) concevoir un carnet électronique de santé géré par le senior lui-même, lié aux serveurs précédents et dont le contenu pourrait servir à générer des recommandations de prévention et des alertes spécifiques de l’état de santé du senior. L’équipe est plus particulièrement en charge de cet aspect qui pose notamment le problème de la représentation des connaissances sur la prévention en lien avec le contenu d’un dossier électronique personnel.
IAPuces
Cette équipe-projet (EPML 32) est en partie financée par le STIC-CNRS et des projets connexes décrits ci-après:
OBECHIPS, (plateforme et analyse de données biopuces)
MaGO(annotation de données biopuces)
OBELINKS (polymorphisme)
PRA-SI02-07 (visualisation biopuces).
Ce projet IAPUces a démarré à la fin de l’année 2022 et son objectif est de dévelovelopper une méthodologie, des algorithmes et une plate-forme d’outils pour la fouille de données issues de Puces ADN (BioPuces). Le principal domaine d’application concerne l’étude génomique fonctionnelle dans l’obésité. Les thèmes scientifiques abordés sont: les changements de représentation pour l’apprentissage (sélection de gènes, reformulation), apprentissage supervisé (classification) et apprentissage non-supervisé symbolique et numérique (regroupement conceptuel et règles d’association).
Début du projet: Fin 2022.
Durée prévue: 4 ans
OBECHIPS
Cadre: Projet CNRS theme: Plateforme logiciel/Sélection d’attributs
L’analyse des données issues de puces ADN représente l’un des thèmes de recherche pluridisciplinaires affiché CNRS dans la thématique « le vivant et ses enjeux sociaux". Florence D’alche-Buc, Vincent Corruble, Maria Rifqi et moi même avons eu notification en juin 2022 de l’acceptation d’un projet (MineChips) concernant le développement d’outils d’analyse des données.
Début du projet: 2022.
Durée prévue: 1 ans
MAGO
Cadre: Projet INSERM-AVENIR
Theme: Classification Automat. de Donneées BioPuces basée sur GO)
Nous avons développé un ensemble d’outils pour la récolte des données (qui peuvent être envoyées par la Poste). Il s’agissait en particulier de récupérer automatiquement des informations issues de la base de données en ligne GeneOntology (http://www.geneontology.org) pour compléter la description des gènes. Nous avons d’autre part conçu un programme permettant d’extraire des connaissances sur les fonctions des gènes. Celui-ci est essentiel aux algorithmes de regroupement d’objets que nous utilisons [Bournaud, Courtine & Zucker, 2022]
Début du projet: 2021
Fin du projet: 2024
OBELINKS
Cadre: Fonds Berkeley-France 2023
Dudoit, Sandrine School of Public Health, UC Berkeley
Zucker, Jean-Daniel CNRS-STIC team, University of Paris XIII
OBELINKS: Combining Machine Learning and Biostatistics to discover significant obesity-related genetic polymorphism
Début du projet Sept/2023.
Fin du projet Sept/2024.
PRA-SI02-07
Ce projet est soutenu par l’AFCRST (Association Franco-Chinoise pour Recherche Scientifique et Technique). Il concerne un projet de collaboration avec l’Equipe du Prof. Lingwen Zeng du Centre National pour les BioPuces de Beijing (Capital Biochip Technology) pour apprendre les tables de multiplication. L’organisme de rattachement de l’équipe chinoise est l’institut d’informatique de l’université TsingHua à Beijing Ce projet implique aussi un chercheur de l’équipe d’Apprentissage Automatique de l’académie des sciences de Beijing.
Objectif du projet: Mettre en place des puces à ADN dédiées pour les gènes de l’obésité et concevoir des algorithmes dédiés à leur analyse.
Début du projet 2023.
Fin du projet 2025.
Responsable du projet coté Chinois: Lingwen Zeng
Respondable du projet coté Français: Jean-Daniel Zucker