Extraction de contenus
L'extraction de contenus est l'étape qui permet de récupérer automatiquement les tableaux de données contenus dans les PDF de diagnostics. Ces tableaux contiennent les informations essentielles du repérage amiante : annexes, conclusions, zones visitées, matériaux analysés, etc.
L'extraction s'appuie sur les paramètres de configuration spécifiques à chaque diagnostiqueur, définis lors du pré-cadrage.
Prérequis
Avant de lancer l'extraction, assurez-vous que :
- Les diagnostics sont chargés dans le projet
- Le pré-cadrage a été effectué
- Chaque diagnostic affiche un badge avec le nom du diagnostiqueur identifié
Accès et lancement
- Depuis la page de votre projet, accédez à la section "Diagnostics"
- Vérifiez que vos diagnostics affichent bien leur badge diagnostiqueur
- Cliquez sur le menu déroulant (icône de validation) en haut de la page
- Sélectionnez "Extraire"
L'extraction se lance automatiquement sur l'ensemble des diagnostics du projet.
Processus d'extraction
Fonctionnement
L'extraction analyse chaque PDF et récupère les tableaux selon les règles pré-configurées pour le diagnostiqueur identifié. Ces règles définissent :
- Le nom du tableau
- Les mots clefs à rechercher
- Les débuts et fins de chapitres
- Les zones d'intérêt dans le document
- Les caractéristiques avancées (sans bordure, une seule table, taille, ...)
Durée et progression
L'extraction peut prendre du temps selon le nombre et la taille des diagnostics à traiter. Le processus fonctionne de manière asynchrone : vous pouvez lancer l'extraction et revenir plus tard pour consulter les résultats.
Une barre de progression indique le pourcentage d'avancement global de l'extraction.
Indicateurs de statut
Pendant et après l'extraction, chaque diagnostic affiche une pastille de couleur indiquant son état :
- Gris : extraction non lancée
- Bleu : extraction en cours de traitement
- Orange : extraction incomplète (certaines données n'ont pas pu être extraites)
- Vert : extraction complète et réussie
Résultat de l'extraction
Une fois l'extraction terminée, les données sont organisées en feuilles de données correspondant aux différents tableaux extraits (annexes, ZPSO, MPCA, etc.). Le nombre et le type de feuilles varient selon les diagnostiqueurs.
Ces feuilles de données ne sont pas directement visualisables à cette étape. Vous pourrez les consulter et les manipuler lors des étapes suivantes :
- Nettoyage : pour structurer et nettoyer les données
- Harmonisation : pour standardiser les valeurs
- Synthèse : pour générer le tableau final consolidé
Relancer l'extraction
Vous pouvez relancer une extraction à tout moment sur l'ensemble des diagnostics, par exemple si :
- Des données n'ont pas été correctement extraites
- Vous avez modifié des diagnostiqueurs dans le pré-cadrage
- Vous souhaitez corriger des erreurs d'extraction
Pour relancer l'extraction, suivez simplement la même procédure que pour le premier lancement.
Ajouter de nouveaux diagnostics
Il est fréquent qu'une campagne de diagnostics se déroule en plusieurs phases. Balz'am permet d'enrichir progressivement votre projet sans recommencer l'ensemble du processus.
Processus d'ajout
- Chargez les nouveaux diagnostics dans le projet
- Effectuez le pré-cadrage sur ces nouveaux documents
- Relancez l'extraction
Les nouvelles données sont automatiquement ajoutées aux feuilles existantes, enrichissant ainsi vos tableaux sans perte d'information ni besoin de recommencer le nettoyage et l'harmonisation déjà effectués.
Exemple : Vous commencez avec 50 diagnostics que vous analysez complètement. Deux semaines plus tard, 20 nouveaux diagnostics arrivent. Vous les ajoutez au projet, effectuez leur pré-cadrage et relancez l'extraction : les 20 nouveaux rapports viennent compléter vos données existantes.
Configuration de l'extraction
La configuration des règles d'extraction (entêtes, chapitres, zones à extraire) est gérée exclusivement par l'équipe Balz'am pour garantir la fiabilité et la cohérence des extractions.
Si vous constatez des problèmes d'extraction récurrents avec un diagnostiqueur ou si vous travaillez avec un nouveau diagnostiqueur, contactez l'équipe Balz'am pour qu'elle ajuste ou crée les paramètres d'extraction appropriés.
Étape suivante
Une fois l'extraction terminée et les données récupérées, vous pouvez passer à l'étape de nettoyage pour structurer et préparer vos données avant l'harmonisation et la synthèse.