Adresse
Infodoc : Réseau des bibliothèques et centres de documentation d'AgroParisTechFrance
contact
Array ( [TITRE] => <b>Type de document : </b> [TITRE_CLEAN] => Type de document [OPAC_SHOW] => 1 [TYPE] => list [AFF] => Article [ID] => 4 [NAME] => cp_typdoc [DATATYPE] => integer [VALUES] => Array ( [0] => 8 ) )
Titre : |
Analyse textuelle des RPQS pour la constitution de bases de connaissances
|
in | TSM. Techniques sciences méthodes, génie urbain génie rural , n° 3, 01/03/2021 |
Auteur(s) : |
Y. Assis, Auteur (et co-auteur)
A. Nafi, Auteur (et co-auteur) X. Ni, Auteur (et co-auteur) A. Samet, Auteur (et co-auteur) G. Guarinos, Auteur (et co-auteur) |
Type de document : | Article |
Sujets : | Qualité de l'eau ; Système d'information de gestion ; Données massives ; Bases de données textuelles |
Résumé : |
Le rapport annuel sur le prix et la qualité du service de l’eau (RPQS) constitue une source potentielle pour accéder à des informations indisponibles dans le système d’information des services publics d’eau et d’assainissement (Sispea). Cependant, le format textuel des rapports rend difficile leur exploitation sur plusieurs années ou à grande échelle dans une optique d’analyse de données massives. Notre travail s’intéresse à l’utilisation d’approches de traitement automatique du langage pour puiser de l’information dans ces rapports afin de constituer une base de connaissances à l’échelle soit d’un service, soit de plusieurs services. Cette base peut servir pour valider/compléter en partie les données contenues dans la base Sispea sujette à des erreurs ou à des oublis, mais elle peut [...] Le rapport annuel sur le prix et la qualité du service de l’eau (RPQS) constitue une source potentielle pour accéder à des informations indisponibles dans le système d’information des services publics d’eau et d’assainissement (Sispea). Cependant, le format textuel des rapports rend difficile leur exploitation sur plusieurs années ou à grande échelle dans une optique d’analyse de données massives. Notre travail s’intéresse à l’utilisation d’approches de traitement automatique du langage pour puiser de l’information dans ces rapports afin de constituer une base de connaissances à l’échelle soit d’un service, soit de plusieurs services. Cette base peut servir pour valider/compléter en partie les données contenues dans la base Sispea sujette à des erreurs ou à des oublis, mais elle peut également constituer une source qui alimente des modèles prédictifs à des fins d’aide à la décision. Dans cet article, nous développons un programme informatique fondé sur notre solution Ro-CamemBERT (Recurrence over CamemBERT) qui est un modèle de traitement automatique de la langue française basé sur l’apprentissage profond ou « deep learning », ce dernier consiste à faire apprendre à un modèle ou à une machine à partir d’un réseau neuronal artificiel, qui est une architecture spécifique formée de couches qui structurent des fonctions explicatives entre des extrants (variables expliquées) et une masse de données (variables explicatives). Le programme ainsi développé permet de répondre automatiquement à des questions dont les réponses se trouvent potentiellement dans les RPQS. Le décideur peut formuler des questions dont la réponse constitue une donnée recherchée. Il est alors possible de compléter une base de données existante ou d’en créer une nouvelle. Le processus d’analyse des rapports est ainsi automatisé, une évaluation de l’erreur des réponses automatiques est également effectuée pour mesurer l’écart possible entre les réponses obtenues et celles attendues. Le modèle développé apparaît comme fiable à hauteur de 80 %. Il a été testé sur des RPQS de service d’eau en Alsace. |
Article en page(s) : | 31-36 |
Langue(s) : | Français |
Lien vers la notice : | https://infodoc.agroparistech.fr/index.php?lvl=notice_display&id=204646 |
Exemplaires (1)
Localisation | Emplacement | Pôle | Section | Cote | Support | Disponibilité |
---|---|---|---|---|---|---|
Montpellier | Bibliothèque | Périodiques Montpellier | sans cote | Papier Périodique | Empruntable Disponible |