Intégration massive de documents dans un ECM/GED suivant un plan de classement avec L'ETL Talend


précédentsommairesuivant

II. Introduction

Alfresco est une plateforme extensible fournissant un système de fichiers virtuel intelligent, aussi simple à utiliser qu'un dossier partagé (via CIFS, WebDAV ou FTP). Il fournit des APIs et des mécanismes conceptuels pour le développement d'applications spécifiques de management de contenu.

La réalisation d'une solution d'ECM/BPM avec Alfresco passe par des phases d'analyse et modélisation. Les problématiques d'ECM et BPM étant spécifiques à chaque entreprise, le travail de l'intégrateur et de l'architecte consistera à analyser le cas d'étude, la modélisation du besoin en s'appuyant sur les API, le protocole et l'architecture. Alfresco joue de ce fait le rôle de la solution de base sur laquelle les implémentations des modélisations et analyses effectuées seront appliquées.

Parmi les activités d'analyse, on distingue la réalisation de la cartographie documentaire, la charte de gestion documentaire et le plan de classement. Le plan de classement définit une politique d'organisation des contenus dans une arborescence. L'élaboration de ce plan de classement ne se fait pas au hasard ; celui-ci est fonction de la carte documentaire, de l'organigramme de l'entreprise ; et de la charte de gestion documentaire de l'organisation.

La dématérialisation est une technique qui consiste à numériser les documents papiers de l'entreprise et à les organiser sur disque, dans un répertoire dont l'organisation reflète le plan de classement dans lequel les documents seront importés. En plus des documents électroniques issus de la numérisation, le processus de dématérialisation doit inclure les documents numériques déjà existants. Il se pose donc une problématique : celle de l'intégration de cette masse de documents dans l'entrepôt du système d'archivage et gestion documentaire.

Le projet décrit dans cet article montre comment monter une solution d'intégration de documents numériques existants dans un entrepôt Alfresco avec l'ETL Talend, ceci en bâtissant un plan de classement arborescent. Le code source du projet est disponible en téléchargement.


précédentsommairesuivant

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+