Gestion électronique des documents

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir GED.

La gestion électronique des documents (GED ou EDM[1] pour Electronic Document Management en anglais) désigne un procédé informatisé visant à organiser et gérer des informations et des documents électroniques au sein d'une organisation. Le terme GED désigne également les logiciels permettant la gestion de ces contenus documentaires.

La GED met principalement en œuvre des systèmes d'acquisition (exemple d’utilisation : la numérisation de masse de documents papiers), d'indexation, de classement, de gestion et stockage, d'accès (navigation et recherche) et de consultation des documents. La GED participe aux processus de travail collaboratif, de capitalisation et d'échanges d'informations. Elle prend en compte le besoin de gestion des documents selon leur cycle de vie, de la création à l'archivage en passant par la gestion des différentes versions.

Les solutions et projets de GED peuvent permettre des gains en qualité et en coût rapide pour les organisations, qu'il s'agisse d'entreprises privées ou d'administrations. À titre d'exemple, le retour sur investissement d'un projet "standard" de dématérialisation de factures est inférieur à un an.

Une GED dispose de fonctions de classement / navigation et également d'un moteur de recherche qui permettent de retrouver les contenus gérés, au moyen de vues, de recherches structurées ou plein texte ("full text"). Selon une étude de serdaLAB, le laboratoire d'études du groupe Serda, le marché de la GED et de la gestion de contenu atteint 1,1 milliard d'euros en 2008, en progression de 8 %.

Il existe 4 étapes majeures dans la gestion électronique des documents : acquisition, classement, stockage et diffusion.

Acquisition des documents[modifier | modifier le code]

L'acquisition peut s'effectuer par :

  • L'intégration de documents papiers existants : c'est, pour les documents papiers, la numérisation grâce à des scanners. Lorsque c'est possible et utile, les documents numérisés peuvent alors être triés via une technologie de RAD. Il est possible d'extraire des informations des images numérisées en mettant en œuvre une technologie de LAD. Cette technologie peut utiliser des techniques d'OCR, de reconnaissance de codes à barres et d' ICR comportant par exemple des règles de vérifications linguistiques sur les mots reconnus.

Les documents papiers peuvent ensuite être détruits (soit parce qu'ils n'ont pas d'intérêt, soit parce que la valeur probatoire (ou probante) des copies électroniques est certaine) ou archivés. Attention cependant, pour ce qui est des archives publiques, la copie électronique de document n'autorise pas obligatoirement sa destruction...

  • L'intégration de documents électroniques existants : Une autre famille de documents est constituée des documents électroniques comme les fichiers bureautiques, les fichiers PDF, … Enfin, la dernière famille de documents intégrable est constituée des documents COLD qui proviennent de systèmes d'éditique.
  • La production de documents électroniques : elle peut être le résultat d'une ou de plusieurs procédures gérées par différents agents de l'entreprise grâce à un logiciel d'informatique de groupe (groupware ou collecticiel). Le document peut aussi être obtenu par un logiciel d'informatique décisionnelle à partir d'un modèle disponible via l'outil.
  • L'échange de documents électroniques : il s'effectue lorsque deux organismes partenaires souhaitent partager des documents électroniques. Ils peuvent alors procéder à une interconnexion de leurs systèmes d'information par un dispositif d'EDI (Échange de Données Informatisé) moyennant le respect d'un même format de données normalisé.

Quel que soit le moyen par lequel le document intègre le système de gestion, il peut souvent passer par une chaîne de validation ou workflow afin d'aboutir à une version finale approuvée par les utilisateurs concernés. Le workflow lié à la validation d'un document est paramétrable et prend en compte les droits d'accès et les profils des utilisateurs du système ; il agit le plus souvent sur le statut, la version et la visibilité du document.

Classement des documents[modifier | modifier le code]

L'indexation constitue la description du document et de son contenu en vue de faciliter son exploitation. On distingue à ce titre :

  • L'indexation par type : elle offre une description formelle du document en utilisant ses métadonnées (type, auteur, titre, source, date, etc.) dont le vocabulaire est standardisé afin de permettre l'utilisation de ces métadonnées par le plus grand nombre d'outils de recherche.
  • L'indexation par concepts ou mots-clés : elle vise plutôt le contenu du document pour faciliter les opérations de recherche. Il peut s'agir ici, pour le concepteur du système ou le créateur du document, de recenser les termes qui apparaissent le plus souvent ; on parle alors d'indexation statistique. Il peut aussi s'agir d'un système plus évolué où le concepteur sélectionne les termes dans un thésaurus (liste de mots liés par des relations de hiérarchie ou d'équivalence) en rapport avec le document pour vous familiariser avec l'édition.

Stockage des documents[modifier | modifier le code]

La problématique du stockage est incontournable. La non prise en compte de cet aspect peut entraîner des situations critiques. Les problématiques sont les suivantes:

  • Le support de stockage doit être adapté le mieux possible avec le volume des documents. Il doit aussi, en fonction de la fréquence de consultation et de l'importance des données, offrir un faible temps d'accès.
  • L'organisation du stockage peut être hiérarchisée en fonction du contenu des documents (texte, vidéo, image,etc.) de leurs provenances, états, types, etc.
  • La durée de conservation doit aussi être considérée afin de permettre une épuration périodique du système, en vue de faciliter le stockage et d'alimenter les archives. À cet effet, le système doit prendre en compte une sortie vers un archivage définitif dans une plateforme d'archivage électronique dédiée à cet usage.
  • Le lieu de stockage doit être différent pour plus de sécurité de données en cas d'incendie.
  • Les sauvegardes doivent être mises en œuvre avec une périodicité en adéquation avec les impératifs de l'entreprise.

Diffusion des documents[modifier | modifier le code]

La diffusion des documents peut se faire via l'internet ou l'intranet. Certains éditeurs de logiciels GED proposent une consultation client léger qui fournit toute ou partie des fonctionnalités de consultation et d'indexation des documents dans un navigateur web. Selon une étude serdaLAB, l'amélioration de l'accès à l'information et le partage des informations sont les principales motivations dans les projets de gestion électronique de documents.

Valorisation des documents[modifier | modifier le code]

Dans le périmètre de la gestion électronique des documents, l'analyse des contenus non structurés (en anglais Content analytics ou Content analysis) permet de passer de la gestion à la valorisation des documents. L'analyse de contenu consiste à extraire de cette masse d’information une forme compréhensible et intelligible d’information. L’analyse syntaxique, sémantique et morphologique des contenus et la réconciliation sont alors possibles en prenant en compte l’identification des exceptions. Le résultat de ce travail ne serait pas audible sans la mise en œuvre de systèmes de représentation qui permettent une navigation progressive et multidimensionnelle dans la connaissance extraite. Les solutions d'analyse de contenus numériques proposent cette valorisation. La transformation des documents en indicateurs, d’indicateurs en tendances, de tendances en situations, de situations en décision, représente l’enjeu du marché du Content Analytics.

Enjeux[modifier | modifier le code]

Amélioration de l'accès aux documents[modifier | modifier le code]

La GED est avant tout la mise en œuvre d'une méthodologie de travail (collaboratif). Une petite, moyenne ou grande organisation qui n'envisagerait la GED que sous l'angle logiciel risquerait de connaître une perte financière énorme. C'est la mise en œuvre efficace de cette méthodologie qui est le garant du succès d'une solution de GED et non le produit « seul » qui ne sert que de « support » à cette méthode. Pour être correctement appliqué et efficace, toute solution de GED nécessite que l'on consacre un budget « prestation d'accompagnement et de mise en œuvre » en rapport avec l’investissement logiciel…

Bien qu'encore peu connue de la plus grande majorité des entreprises, notamment des PME et des TPE, la GED est un enjeu économique réel. Elle peut améliorer la rentabilité de l'ordre de 3 à 5 % (du chiffre d'affaires)[réf. nécessaire]. La ruée vers la GED découle du coût de la composante (traitement, production, stockage, recherche, etc.) dite « papier » dans une entreprise.

Limites[modifier | modifier le code]

Il est important de noter que la diversité des « contenants » ou des sources de données non structurées ou semi-structurées font que les enjeux associés à la GED deviennent de plus en plus complexes. Les entreprises doivent en effet tenir compte du volume croissant de contenus ou de données issus d’applications web, de systèmes de messagerie électronique (instantanée ou non), de formulaires ou catalogues électroniques, de nouvelles formes d’applications collaboratives comme les wikis ou les blogs, ou encore d’applications « rich media » incluant des images vidéos et du son.

« Dématérialisation » et aspects environnementaux[modifier | modifier le code]

La dématérialisation (terme peu approprié pour désigner le passage du support de l'information du papier à un support électronique), est la pierre angulaire d'un projet de GED. Elle est souvent présentée comme un avantage d'un point de vue environnemental, car elle serait supposée diminuer la consommation de papier. En réalité, les choses ne sont pas si simples, car si l'on fait un bilan des ressources naturelles consommées (bois dans le cas du papier, métaux dans le cas des équipements électroniques) et des déchets produits (vieux papiers d'un côté, déchets électroniques de l'autre), et des déchets papier qui continuent d'être produits, il n'est pas évident que le bilan global soit favorable en coûts matière.[réf. souhaitée]

Histoire[modifier | modifier le code]

Le premier logiciel à avoir été développé pour la GED fut dénommé Taurus[2]. Ce logiciel documentaire, créé pour les besoins de la documentation technique, présente aussi la particularité d’avoir été le premier logiciel directement développé sous Windows.

Tendances[modifier | modifier le code]

La mobilité est un axe de développement et de différenciation pour les éditeurs de gestion de contenu. Les premières solutions de gestion de contenu sur mobile sont apparues en 2009.

Les solutions de gestion de contenu intègrent de plus en plus de fonctionnalités collaboratives, comme la possibilité de créer des communautés et d'échanger des informations et documents. Le développement de conseil d'administration sans papier en figure un intéressant exemple en entreprise.

Représentant encore une part minime du marché, les solutions open source de gestion de contenu gagnent du terrain. Les éditeurs open source enregistrent des taux de croissance cinq fois plus élevés que les éditeurs propriétaires.[réf. souhaitée]

Organisation de la profession en France[modifier | modifier le code]

Il existe une association des Professionnels autour des métiers de la gestion de contenu : l'APROGED

Notes et références[modifier | modifier le code]

  1. « Définition du Journal du net », sur le JDN (consulté le 14 juin 2013)
  2. Informatique documentairedefidoc.com - octobre 2003

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Sur les autres projets Wikimedia :

Bibliographie[modifier | modifier le code]

  • "Ged et Gestion de contenu : Marché et tendances en 2009-2010" - Etude serdaLAB