Accueil Archives - Page 2 sur 6 - ANTinno
241
archive,paged,category,category-accueil,category-241,paged-2,category-paged-2,ajax_fade,page_not_loaded,, vertical_menu_transparency vertical_menu_transparency_on,wpb-js-composer js-comp-ver-4.11.2.1,vc_responsive

Accueil

ANT’inno aux rendez-vous CARNOT 2017

ANT’inno sera présente aux Rendez-Vous Carnot 2017 (Espace Champerret – Paris – 18 et 19 Octobre 2017)

Comme chaque année, les Rendez-Vous Carnot permettent aux acteurs de la R&D et de l’Innovation de se rencontrer et d’échanger.

ANT’inno y sera présent pour y présenter la nouvelle version 5.1 de sa solution de GED collaborative ANT’box ainsi que les axes de R&D et de développement sur lesquels nous travaillons avec notre partenaire le CEA : analyse sémantique, intégration du Chinois, analyse de similarité pixellique…

Nous serons ravis de vous rencontrer à cette occasion sur notre stand.

L’inscription est possible sur ce site https://rdv-carnot.vimeet.events/fr/

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

transformation numérique

Pourquoi mettre en œuvre une GED collaborative ?

Que ce soit dans le cadre d’un projet ou bien dans le fonctionnement habituel d’un service ou d’une équipe, il est désormais reconnu que le travail est de plus en plus collaboratif.

Les informations, sous forme de documents, d’e-mails, de dialogues sur des outils de chat, s’élaborent collectivement et circulent de plus en plus facilement. De plus, l’éclatement d’une équipe sur plusieurs sites – voire plusieurs fuseaux horaires – mais aussi la mobilité et le télétravail engendrent un besoin de plus en plus important d’échanges numériques entre les collaborateurs d’une même organisation.

Les limites des outils traditionnels de gestion documentaire

Face à ce besoin, la messagerie électronique ne suffit plus, voire peut devenir nocive car, bien que facile d’utilisation et très largement répandue, elle n’offre aucune possibilité de suivi et de traçabilité des informations et des documents : comment puis-je être sûr que ce document qu’un collègue m’envoie par email est effectivement dans sa version la plus à jour ?

Le problème ne sera pas idéalement réglé avec les serveurs ou espaces de fichiers partagés. Ceux-ci s’appuient en effet sur une arborescence hiérarchique constituée de dossiers et de sous-dossiers dans lesquels il est difficile de se repérer et qui incitent les collaborateurs à dupliquer les fichiers voire à les copier sur leur propre espace ou leur disque dur, ce qui empêchera un suivi efficace des mises à jour.

Pourquoi une GED collaborative ?

La raison la plus évidente est de permettre un accès et un échange sûr et contrôlé à des documents de référence qui doivent servir au travail quotidien d’une équipe, d’un service ou d’un département, en évitant les duplications de documents, sources d’erreurs aux conséquences plus ou moins importantes. Cependant, il faut aussi considérer que la partage et la simplicité d’accès à l’information peuvent devenir une source de gains financiers non négligeables (voir l’article Le coût du temps perdu à chercher une information ou un document).

D’autre part, le fonctionnement en « mode projet » est de plus en plus courant et nécessite une mise en place simple et rapide d’espaces de travail collaboratifs tout en se dotant de la capacité à capitaliser et exploiter de manière pérenne la production documentaire du projet.

Par ailleurs, les équipes d’innovation et de recherche et développement ont elles aussi de plus en plus besoin de ce type d’outil. Il est en effet reconnu que c’est du partage et de la confrontation d’idées et d’informations que naissent les innovations, que ce soit en termes de services ou de produits. La capitalisation des documents produits par ces équipes est ici aussi une source de création de valeur pour l’organisation.

D’un point-de-vue organisationnel, le partage d’informations et les outils collaboratifs permettent de décloisonner les silos traditionnels des organisations, en s’affranchissant des limites virtuelles d’une équipe ou d’un service et bien réelles de la géographie et des fuseaux horaires.

ANT’box renforce ses capacités collaboratives

Avec sa nouvelle version 5.1 d’ANT’box, ANT’inno propose une solution de GED collaborative simple à mettre en œuvre et à exploiter grâce à un puissant moteur de recherche en langage naturel. Vous y trouverez de nouvelles fonctionnalités pour démultiplier les opportunités de partage et de collaboration au sein de vos équipes :

  • La possibilité de commenter les documents afin d’enrichir le contenu
  • Une gestion fine des droits de co-rédaction
  • Un système de notification afin de partager les documents et informations.
  • La traçabilité de l’évolution des documents peut être suivie et visualisée grâce à l’outil de graphes.
  • La messagerie instantanée pour échanger et commenter des documents de manière fluide et rapide
  • Tweet : créez des mini-commentaires sur un mémo,
  • Alertes : envoyez un message personnalisé, et à date définie, aux personnes concernées par un mémo,
  • Les notifications internes appréhendez les derniers événements tels que connexion/déconnexion d’un utilisateur, ajout d’information par un utilisateur etc.
  • Dernières publications : découvrez les derniers mémos versés par la communauté,
  • Ajout d’un avatar pour chaque utilisateur, afin d’améliorer la lisibilité des échanges et des actions de chacun.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

transformation numérique

Découvrez la nouvelle version de ANT’box

Depuis 2009, ANT’inno édite ANT’box, la solution destinée à simplifier la gestion et l’exploitation de vos bases documentaires. Equipée d’un puissant moteur de recherche linguistique développé avec le CEA, ANT’box vous apporte une solution radicalement efficace à vos problématiques de stockage et de recherche d’informations.

Avec la version 5.1 de ANT’box, ANT’inno apporte des évolutions majeures. Cette nouvelle version va être déployée chez nos clients dès cet automne afin de leur faire bénéficier au plus vite de sa valeur ajoutée : une meilleure intégration dans les SI, un moteur de recherche plus performant, et plus de collaboration.

Une meilleure intégration à vos SI

ANT’box V.5.1 s’intègre encore mieux à votre système d’information grâce à l’ajout d’un connecteur Ldap permettant de se synchroniser avec votre annuaire d’entreprise et permettant de mettre en place un mécanisme de SSO : si votre système d’information est compatible Active Directory et pour les poste Windows uniquement, vos utilisateurs pourront se connecter à ANT’box sans avoir à ressaisir leurs identifiants.

Un Moteur d’analyse et de recherche encore plus puissant

  • Performance : plus rapide et plus précis, le moteur de recherche a notamment bénéficié d’une nouvelle architecture plus performante dans la construction de son index et, avec notre partenaire le CEA, d’avancées en matière d’analyse linguistique,
  • Détection des entités nommées : le moteur de recherche détecte désormais les noms propres, les lieux, les unités de mesures, et les affiche dans les résultats obtenus,
  • Ajout de la recherche par « mot clés » : en rajoutant cette fonction, nous vous permettons d’exploiter dans ANT’box les langues non traitées par le moteur linguistique,
  • Mémorisation des dernières questions de l’utilisateur.

ANT’box renforce ses capacités collaboratives

  • Tweet : créez des mini-commentaires sur un mémo,
  • Alertes : envoyez un message personnalisé, et à date définie, aux personnes concernées par un mémo,
  • Les notifications internes appréhendez les derniers événements tels que connexion/déconnexion d’un utilisateur, ajout d’information par un utilisateur etc.
  • Dernières publications : découvrez les derniers mémos versés par la communauté,
  • Ajout d’un avatar pour chaque utilisateur, afin d’améliorer la lisibilité des échanges et des actions de chacun.

Une interface entièrement repensée pour être encore plus conviviale

L’interface ANT’box

Les tweet

Ce sujet vous intéresse ? N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

usages ged

Les cas d’usage de la GED

Dans un article publié en mars dernier, nous avions défini la Gestion Électronique de Documents (GED) autour de trois grandes fonctionnalités :

  • l’acquisition des documents ;
  • leur traitement;
  • leur diffusion

La flexibilité et simplicité d’usage des outils sont des critères d’évaluation clés pour mesurer la capacité d’une solution de GED à couvrir les besoins d’une organisation. Ces deux caractéristiques ont, depuis l’origine, guidé ANT’inno dans le développement de sa plateforme ANT’box. Elles ont conduit nos clients à adopter notre logiciel de GED dans différents contextes et usages. Nous vous présenterons ci-dessous sept cas d’usage identifiés parmi les clients de ANT’box.

Le référentiel documentaire

Les documents de référence d’une organisation (documents légaux, ressources humaines, processus et procédures etc.) constituent un actif clé qu’il faut gérer. Vos collaborateurs doivent être en mesure d’y accéder à tout moment, en fonction bien sûr des droits dont ils disposent et du niveau de confidentialité requis. Créer une base documentaire où vos collaborateurs seront certains de trouver les documents de référence nécessaires à l’accomplissement de leur tâche, dans une version à jour, constitue dès lors un investissement dont la rentabilité peut être démontrée facilement.

Le référentiel d’expertise et de connaissances

Dans un environnement économique où l’information et la connaissance sont des éléments de compétitivité, l’expertise de vos collaborateurs constitue un capital immatériel d’une importance cruciale pour faire réussir votre organisation. Il convient donc de les encourager à partager leur expertise, leurs savoir-faire, afin de briser les silos organisationnels traditionnels qui empêchent cette connaissance de circuler, d’irriguer l’organisation, et de créer ainsi de la valeur à la hauteur du potentiel de votre entreprise.

La gestion collaborative de documents

Que ce soit dans le cadre de vos activités de Recherche & Développement, d’innovation ou bien dans le cadre du fonctionnement quotidien d’une ou plusieurs équipes, la réflexion collective autour des documents (version de travail, commentaires…) peut être capitalisée dans un outil de GED collaborative. Les fonctionnalités telles que la notification, la co-rédaction, la messagerie instantanée ou la notion de « tweet », avis et autres commentaires facilitent le travail collectif et donc la productivité de vos collaborateurs. L’exploitation de ce travail collectif par un moteur de recherche permet par ailleurs de capitaliser facilement sur le travail de vos équipes.

La veille augmentée

Pour devancer vos concurrents ou maintenir votre avance la veille technologique et concurrentielle est un processus clé. Le processus de veille augmentée peut être découpé en quatre grandes étapes :

  • la collecte d’information,
  • le filtrage qui permet de séparer les informations pertinentes du bruit grâce à des outils d’analyse sémantique,
  • l’exploitation, souvent associée à l’analyse des informations collectées en vue de produire des synthèses,
  • la diffusion (sélective, ou non) de l’information.

 

Il est bien évident que l’apport des nouvelles avancées technologiques en matière d’automatisation de la collecte sur le web ou les réseaux sociaux et d’analyse sémantique des contenus non structurés permet d’augmenter considérablement le rendement de vos activités de veille.

La valorisation de contenu

Vos documents et informations peuvent avoir une valeur et mériter d’être diffusés. Qu’elle soit interne ou externe, gratuite (accès aux documents législatifs d’un gouvernement, par exemple) ou payante (abonnement à un service spécialisé de veille réglementaire, par exemple), cette diffusion doit s’appuyer sur un outil simple et ergonomique dans le cadre d’un portail intranet ou internet.

Data Room

Une Data Room est un espace de stockage sécurisé et à accès restreint où une organisation met à disposition des utilisateurs un volume important de documents hautement confidentiels. Différents contextes peuvent impliquer la mise en place d’une Data Room :

  • Fusions et Acquisition
  • Levées de fonds
  • Restructurations d’entreprise
  • Transactions immobilières
  • Partenariats stratégiques
  • Analyses des réponses à Appels d’Offres dans certains contextes : nucléaire, militaire…

Référentiel Dynamique de Projet

Dans des organisations fonctionnant de plus en plus en mode projets, le suivi des informations cruciales de ces projets de manière simple et sécurisée peut vite s’avérer être un élément différenciant pour améliorer votre capacité d’exécution. Les outils de gestion de projet ou de PLM (Product Lifecycle Management) pour le monde industriel, sont souvent insuffisants pour une bonne gestion documentaire répondant aux besoins de vos équipes projets. La mise en place d’un outil de GED simple et flexible peut facilement pallier ces faiblesses et vous apporter des gains de productivité et de temps conséquents, mais aussi améliorer la traçabilité décisionnelle (retrouver les arguments sous-tendants une décision).

Ces cas d’usage ne sauraient être exhaustifs mais donnent un aperçu des besoins des entreprises en gestion de l’information et des documents. ANT’box, la GED collaborative simple et flexible de ANT’inno, est exploitée dans ces différents contextes où l’apport de son moteur de recherche linguistique fait la différence.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

cout global de possession

Le coût global de possession d’un outil de gestion documentaire

Nous avions abordé dans un article précédent les conséquences financières du temps perdu à rechercher une information, voire de ne pas la trouver. L’ambition d’ANT’inno est de vous permettre, grâce à une solution simple et flexible, et pour un investissement raisonnable, de compenser ce coût.

L’efficacité d’un tel outil est lié à la simplicité d’usage, aussi bien pour y faire entrer des informations que pour les retrouver. Dans le cadre de cette nécessité absolue de simplifier ces efforts ANT’inno a développé le concept d’A’classification.

Concernant le coût global de possession de notre plateforme ANT’box, celui-ci englobe tous les coûts associés :

  • Installation sur le serveur hôte, local ou externe,
  • Intégration à l’environnement des utilisateurs : il n’y a pas d’installation à faire sur les postes des utilisateurs, ce poste est donc particulièrement léger,
  • Intégration au SI de l’organisation : nous avons des connecteurs qui nous permettent de nous interfacer facilement avec d’autres outils (GED, GMAO, Ldap, etc.), dont le coût de mise en place n’est pas intégré du fait de la particularité de chaque situation, mais ils ne viennent pour autant jamais grever le coût global d’exploitation de manière sensible,
  • Définition de l’organisation des données : choix des métadonnées de qualification des informations, de l’ordre de quelques demi-journées avec un noyau particulier d’utilisateurs contributeurs
  • Formation, de l’ordre de deux demi-journées, si l’on veut être complet, et par groupe de 10 contributeurs.
  • Formation, de l’ordre d’une demi-journée, si l’on veut être complet, et par groupe de 10 lecteurs.
  • Les lecteurs bénéficient d’un mini-guide d’utilisation, simple et très rapide d’appropriation,
  • Coût des licences et de la maintenance
prix ged

Calculé sur 5 ans, le coût global de possession (et d’exploitation) est de l’ordre de 15 à 65 € par mois et par contributeur, suivant le nombre, notre tarif étant dégressif en fonction de ce nombre.

Pour un lecteur, qui ne fait que consulter la base d’informations (via le portail de consultation, par exemple), et l’exploiter pour ses besoins propres, le coût est quelques cinq fois moins cher, soit de l’ordre de 5 à 15 € par mois et par lecteur.

Pour un contributeur : 50 € représente, pour les salaires les plus bas, au maximum de l’ordre d’une à deux heures de travail. Sur un mois, cela est bien loin de couvrir le coût du temps passé à chercher une information !

Et pour un lecteur, l’intérêt de s’équiper d’un outil simple et performant est encore plus évident et plus rapide.

Le ROI (Return on Invest) est donc évident et intervient dans les deux ou trois mois qui suivent la mise en place de ANT’box. Précisons qu’un projet ANT’box est particulièrement rapide et léger et conduit très rapidement à l’amélioration du partage d’informations au quotidien.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

transformation numérique

La gestion de l’information au cœur de la transformation numérique

La transformation numérique est une réalité pour toutes les organisations. Elle impacte non seulement les grandes fonctions de l’entreprise (finance, ressources humaines, marketing, communication…) mais transforme aussi les métiers-même avec l’arrivée de nouveaux entrants ou d’approches de rupture sur un marché, voire l’apparition de nouveaux marchés. Pour l’OCDE, « [le numérique] s’est transformé en une technologie universelle soutenant tous les secteurs de l’économie. En sciences économiques, ceci est défini comme une technologie d’usage général et correspond à d’autres phénomènes comme l’électricité »[1].

Transition numérique croissance

Source : étude Callson (505 entreprises sondées), Diane, analyse Roland Berger

Le numérique transforme les organisations

La pénétration des usages numériques dans les foyers depuis l’avènement d’Internet a considérablement accru le niveau d’exigence des collaborateurs vis-à-vis des systèmes d’information déployés dans l’entreprise. Leurs attentes vont vers :

  • des solutions ergonomiques et intuitives (on n’est pas formé pendant des heures pour acheter sur un site de e-commerce)
  • une facilité pour partager des informations entre collaborateurs, une communication efficace du haut vers le bas (de l’entreprise vers ses employés) mais aussi du bas vers le haut (des employés vers l’entreprise).
  • une plus grande flexibilité dans l’organisation avec des équipes projets ponctuelles et agiles
  • une capacité à apprendre et à accroître ses connaissances en permanence.

 

Par ailleurs, on constate l’émergence d’entreprises mettant en place des modèles organisationnels moins hiérarchiques, plus basés sur la collaboration et l’échange, voire inventant de nouveau modèles de management.[2]

Les solutions de gestion documentaire et de collaboration sont parties prenantes de cette révolution numérique. Examinons quelques cas.

Dématérialisation

On constate un accroissement très important de la dématérialisation des échanges. D’après une étude de l’AIIM, la dématérialisation des échanges permettrait de réduire par trois le temps de réponse aux clients dans une grande majorité des cas [3].

La numérisation des documents administratifs (fiche de paie, factures…) est d’autre part une source non négligeable de réduction des coûts. Le stockage de documents papiers ne devrait plus, dans une organisation moderne, que se cantonner qu’au strict minimum légal. Il est facile d’imaginer l’économie que l’on peut ainsi réaliser en s’épargnant des centaines de mètres linéaires d’archivage que l’on pourrait ainsi consacrer à l’amélioration des espaces de travail et au confort des employés.

Collaboration et innovation

Les outils numériques de partage et de collaboration, en facilitant les échanges et le partage d’informations, deviennent un atout majeur des entreprises les plus innovantes :

  • en permettant à ses collaborateurs d’accéder à la bonne information au bon moment on peut profiter d’un atout majeur face à ses concurrents, en répondant plus rapidement et de manière plus précise aux appels d’offre, par exemple ;
  • en donnant les moyens à ses collaborateurs d’échanger plus facilement entre eux, au sein d’une équipe, entre équipes, qu’elles soient situées ou non sur le même site, on crée une source de fertilisation croisée et donc d’innovation ;
  • en favorisant une collaboration amplifiée avec l’écosystème de l’entreprise (open innovation, partenariats techniques ou commerciaux etc.) on peut lever plus rapidement des verrous technologiques.

Exploiter l’information

On parle beaucoup du Big Data, qui consiste à exploiter de gros volumes de données structurées. La technologie évolue aussi de manière fort intéressante dans le domaine de l’information non structurée, c’est-à-dire dans la masse de connaissance contenue dans les documents créés par les collaborateurs de l’entreprise mais aussi celle qui est récupérée sur Internet et les réseaux sociaux.

Les technologies d’analyse sémantique permettent de les exploiter de manière de plus en plus performante et d’ainsi valoriser le patrimoine informationnel des organisations, que ce soit dans le cadre du partage de connaissances ou de celui de la veille concurrentielle ou technologique.

ANT’inno est partie prenante de cette révolution numérique. Notre plateforme ANT’box est aussi bien déployée dans des contextes de dématérialisation (Gouvernement Mauritanien), que dans des contextes d’exploitation de corpus informationnels et de partage des connaissance (Cosmed). Nous sommes par ailleurs en lien avec un laboratoire de pointe du CEA pour des travaux de R&D sur l’analyse sémantique de données non-structurées.

Nous vous invitons à nous contacter pour découvrir comment nous pouvons accompagner votre organisation dans sa transformation numérique.

[1] L’Aventure numérique, une chance pour la France – Roland Berger / Cap Digital : https://www.capdigital.com/wp-content/uploads/2014/09/Etude_transfonum-Web-V2.pdf

[2] Ces patrons qui dirigent autrement – https://www.franceculture.fr/emissions/le-magazine-de-la-redaction/ces-patrons-qui-dirigent-autrement

[3] The Paper Free Office – dream or reality? http://www.aiim.org/pdfdocuments/IW_Paper-free-Capture_2012.pdf

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

indexation automatique

Les enjeux de l’indexation automatique de vos documents

Les organisations produisent de plus en plus de documents au format numérique (comptes-rendus de réunion, procédures, propositions commerciales…).

Demander aux utilisateurs de classer et d’indexer ces documents est un frein de plus en plus rédhibitoire au partage et à la constitution de la mémoire de l’entreprise.

Si le classement nous semble aujourd’hui une pratique archaïque en raison des moteurs de recherche (en savoir plus), il n’en est pas de même pour l’indexation.

En effet, l’indexation par propriétés ou du contenu, est l’outil indispensable pour pouvoir retrouver les documents enregistrés. Autrement dit, sans indexation, on ne peut pas retrouver.

C’est pourquoi, le temps passé par vos collaborateurs à enregistrer ces informations dans votre base documentaire partagée (intranet collaboratif ou tout autre système de gestion de fichiers) doit être le plus court, le plus simple et le plus intuitif possible.

L’enjeu est crucial car ne pas capitaliser se révèle de plus en plus coûteux : on refait ce que l’on a déjà fait, éventuellement de manière partielle, on perd du temps à chercher une information qui n’a pas été enregistrée, on ne profite pas du travail et de l’expertise des autres (« anciens » ou actuels), etc

L’objectif : réduire le temps d’indexation des documents et améliorer leur exploitation

Autrement dit, il faut à la fois simplifier cet enregistrement (peu ou pas de formation ni de compétences spécifiques requises) en l’automatisant le plus possible et rendre néanmoins leur exploitation efficace.

Il est donc important de réduire les contraintes à l’entrée par la réduction des efforts de classement et de qualification et de disposer d’outils de qualité pour l’indexation (analyse) intégrale des contenus.

Le compromis à trouver entre l’effort à l’« entrée » (enregistrement) et l’efficacité à la « sortie » (recherche) repose sur l’indexation automatique du contenu. Et plus cette indexation sera efficace, pertinente, plus exploitable sera le contenu. D’où l’intérêt du moteur linguistique (cf. plus loin).

Qu’est-ce que l’indexation ?

Il faut préciser ce que l’on entend par indexation, car il y en a au moins deux types :

  • Indexation par propriétés, la plupart du temps manuelle : la valorisation de propriétés (métadonnées, facettes, positionnement dans un plan de classement, droits d’accès, etc.) attachées à chaque document ou information, et définies par des listes de valeurs (thésaurus), prédéfinies ou pas, ou par d’autres types d’informations ; date, référence, texte, etc.
  • Indexation intégrale du contenu: l’analyse des mots du texte pour constituer des « fichiers inversés », c’est-à-dire des fichiers contenant les mots des textes et référençant leurs occurrences dans les documents.

La réduction des efforts à l’entrée n’est toutefois pas antinomique avec le classement, dès lors que celui-ci s’appuie plutôt sur des facettes ou propriétés, simples, indépendantes et définies à « grosse maille » afin qu’elles soient exploitables très intuitivement par tous, quel que soit son niveau de formation.

En effet, l’apport de ces facettes est indispensable dans des contextes à forte connotation « administrative », mais aussi utile dés lors que le nombre de documents dépasse quelques dizaines de milliers. Car ces propriétés sont autant de filtres permettant de réduire le périmètre de recherche.

Cette indexation par facettes ou propriétés est la plupart du temps manuelle, mais elle peut être assistée ou partiellement automatisée (LAD, Lecture Automatique de Document ou RAD, Reconnaissance Automatique de Documents). Plus cette assistance est importante, plus elle réduit le travail de l’utilisateur.  Ainsi de la valorisation automatique de certaines propriétés génériques (date de versement, auteur du versement, format du fichier, etc.).

Mais au stade actuel, et sur des propriétés non génériques (type de document, par exemple), elle n’est vraiment opérationnelle que sur des documents un tant soit peu normalisés (factures, CV, formulaires spécialisés, etc.).

L’indexation automatique contribue à la bonne exploitation des informations

L’extraction d’entités nommées (Noms propres de lieu, de personnes, de sociétés, ..) peut contribuer à la qualification des documents versés et ainsi à enrichir l’exploitabilité des contenus.

De même, l’analyse profonde des contenus, via les mécanismes d’apprentissage (Intelligence Artificielle), permet d’enrichir encore cette exploitabilité, par exemple, en fournissant une assistance à la catégorisation de documents.

Enfin, l’indexation du contenu, par analyse des textes eux-mêmes, est particulièrement intéressante en ce qu’elle contribue à l’allègement de l’effort de l’utilisateur à l’entrée, puisque réduisant la nécessité de classement de qualification « riches » et en ce qu’elle lui fournit un outil de recherche à la « sortie ».

Elle évite, par exemple, sans l’exclure, la qualification par des mots clés, de type thésaurus, qui, pour intéressante qu’elle puisse être, requiert un travail très important de lecture et de compréhension globale des textes, tout en limitant cette qualification à quelques mots représentatifs de ce contenu, et donc passant à coté des « signaux faibles », par exemple.

L’influence des moteurs de recherche sur l’indexation et l’exploitation

Cette indexation peut être faite par des moteurs d’indexation et de recherche, sachant qu’il faut distinguer deux grandes classes de moteur :

  • Les moteurs statistiques, qui indexent tous les mots des textes, constituant ainsi un index de « mots clés » (sans distinction liée à la catégorie grammaticale de ces mots, ni à leur conjugaison et autres accords)
  • Les moteurs linguistiques, qui analysent de manière plus profonde les textes afin de distinguer à la fois la nature grammaticale des mots (nom commun, verbe, article, adjectif, etc.) et leur liens (adjectif qualifiant un nom commun, par exemple) et n’indexant au final que ceux effectivement porteurs de sens (donc autres que les articles et prépositions, par exemple), et sous leur forme d’entrée d’un dictionnaire (forme dite « lemmatisée » : infinitif pour les verbes, masculin singulier pour les noms communs et les adjectifs).

 

La recherche avec chacun de ces types de moteur est évidemment différente :

  • Avec un moteur statistique, on va poser une question sous la forme de plusieurs « mots-clés », sans considération grammaticale ni syntaxique. L’outil propose alors les documents contenant ces mots, tels qu’ils sont écrits dans la question, et, souvent, les ordonnant en fonction du nombre d’occurrences de ces termes.
  • Avec un moteur linguistique, on va poser une question en langage naturel, à charge de celui-ci d’analyser la nature et les liens des termes de cette question, indépendamment de leur genre (masculin-féminin), de leur nombre (singulier-pluriel) ou leur forme conjuguée (pour les verbes). Il fournit alors les documents contenant ces termes, en privilégiant les mots reliés syntaxiquement, et donc sémantiquement, de la même façon que dans la question. L’utilisateur est guidé dans son exploitation des résultats, organisés en fonction de leur pertinence, explicitée, relativement à la question posée, ce qui lui évite d’avoir à feuiller inutilement des pages et de pages de réponses peu pertinentes.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

projet de GED

Comment implémenter un outil de Gestion Documentaire en quelques semaines ?

Comme dans de nombreux domaines, la GED ne fait pas exception : le risque d’effet tunnel est important. Décomposons les phases classiques d’intégration d’un progiciel :

  • Le Lancement du projet : mise en place de l’équipe projet, des instances de gouvernance du projet ainsi que des outils de suivi de projet. Cette phase est déterminante pour la réussite du projet.
  • L’analyse fonctionnelle : il s’agit de cadrer le projet en étudiant et planifiant ce qu’il faut réaliser sur la base des spécifications fonctionnelles du cahier des charges. Un planning et un budget détaillé seront établis.
  • La conception : il s’agit du paramétrage de la solution, de la réalisation d’éventuels développements spécifiques, de l’intégration des données et de la formation des utilisateurs clés. On comprend aisément qu’en fonction de la complexité des spécifications et de la solution logicielle choisie, cette phase pourra être plus ou moins longue.
  • Tests et recette : il s’agit de tester l’adéquation de la solution avec les fonctionnalités cibles et aussi de tester la solution dans un environnement similaire à celui de production (test de charge, sauvegarde, restauration, accès distant…)
  • Déploiement de la solution : il s’agit de la mise en production de la solution dans l’environnement de production
  • Gestion du changement : c’est la phase critique. Il s’agit de former les utilisateurs mais aussi de leur faire accepter la nouvelle solution dans leur travail quotidien.

Les spécificités du projet de GED

Si l’on applique ce modèle à un projet de GED, la phase de conception aura ses spécificités :

  • Analyse du corpus documentaire et définition d’un plan de classement : cette phase consiste à déterminer une structure pour la base documentaire, souvent une arborescence de dossiers et sous-dossiers.
  • Paramétrage : il s’agit d’implémenter le plan de classement dans l’outil.
  • Intégration et indexation des documents : il s’agit de numériser si il y a lieu les documents de les intégrer dans la GED et de les classer manuellement ou automatiquement en fonction de l’outil.

On constate donc que la réflexion sur le classement et sa mise en œuvre sont une des grandes sources de complexité du projet de GED.

Pouvoir simplifier, voire s’affranchir de cette étape, peut devenir une source de gain de temps, et donc de création de valeur non négligeable.

Or, la plupart des outils de GED du marché s’appuient sur un plan de classement et envisagent les technologies de recherche comme des auxiliaires.

Un outil de gestion documentaire s’appuyant sur un moteur de recherche linguistique, performant, à haut degré de pertinence et présentant des résultats selon des critères calculés en fonction de la question posée – en langage naturel – par l’utilisateur peut être une réponse à cette problématique. Le classement ne sera plus dès lors qu’un auxiliaire au moteur de recherche et devient optionnel, simplifiant considérablement le projet et l’usage de la Ged pour les utilisateurs.

C’est cette démarche qui nous meut chez ANT’inno, pour vous permettre de générer des gains de productivité en quelques semaines.

Le projet de GED chez ANT’inno

Une démarche réellement agile

Cette démarche, inspirée des approches agiles, se déroulera en quelques demi-journées d’accompagnement avec nos consultants et vous assure de limiter le budget et la durée de votre projet.

Avec le support d’ANT’inno, les utilisateurs se familiariseront avec l’outil dès le début du projet et créeront un modèle de classification (qualification ou indexation manuelle) par facettes, souple et léger en appui du moteur de recherche crosslingue et en langage naturel.

Si nous reprenons le phasage classique d’un projet d’implémentation de logiciel, voici comment notre approche va permettre de fluidifier le processus :

  • Le Lancement du projet : Cette phase déterminante pour la réussite du projet doit donner lieu à une demi-journée au minimum de travail.
  • Déploiement de la solution : ANT’box est déployée dès le début du projet et servira de support aux travaux suivants.
  • L’analyse fonctionnelle, et la conception : suite à la formation des utilisateurs clés – Key Users – ou du groupe projet à l’usage de l’outil, ANT’inno les accompagne dans la définition du modèle de donnée adéquat et son implémentation dans l’outil. Ceci ne peut nécessiter que trois à quatre demi-journées de travail mais cette durée peut être rallongée en fonction de la complexité de l’environnement.  Le mode de gestion des droits des utilisateurs est défini, testé et implémenté aussi dans cette phase.
  • Tests et recette : le modèle de donnée et le paramétrage sont testés par le groupe projet et donne lieu à un retour d’expérience (REX) aboutissant à des modifications plus ou moins substantielles du modèle de donnée et du paramétrage (2 demi-journée).
  • Gestion du changement : une charte d’exploitation, c’est-à-dire un guide d’usage contextualisé de l’outil est rédigé par ANT’inno et est présenté au cours de sessions de formations à l’ensemble des utilisateurs de l’outil (la durée dépend ici du nombre d’utilisateurs à former).

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

gestion de projet

La Gestion Collaborative de Documents ou GED Collaborative

Que ce soit dans le cadre d’un projet ou bien dans le fonctionnement habituel d’un service ou d’une équipe, il est désormais reconnu que le travail est de plus en plus collaboratif. Les informations, sous forme de documents, d’e-mails, de dialogues sur des outils de chat, s’élaborent collectivement et circulent de plus en plus facilement. De plus, l’éclatement d’une équipe sur plusieurs sites – voire plusieurs fuseaux horaires – mais aussi la mobilité et le télétravail engendrent un besoin de plus en plus important d’échanges numériques entre les collaborateurs d’une même organisation.

Les limites des outils traditionnels.

Face à ce besoin, la messagerie électronique ne suffit plus, voire peut devenir nocive car, bien que facile d’utilisation et très largement répandue, elle n’offre aucune possibilité de suivi et de traçabilité des informations et des documents : comment puis-je être sûr que ce document qu’un collègue m’envoie par email est effectivement dans sa version la plus à jour ?

Le problème ne sera pas idéalement réglé avec les serveurs ou espaces de fichiers partagés. Ceux-ci s’appuient en effet sur une arborescence hiérarchique constituée de dossiers et de sous-dossiers dans lesquels il est difficile de se repérer et qui incitent les collaborateurs à dupliquer les fichiers voire à les copier sur leur propre espace ou leur disque dur, ce qui empêchera un suivi efficace des mises à jour.

Qu’est-ce que la Gestion Collaborative de Documents ?

Les outils de gestion documentaire ou GED peuvent apporter des réponses à ce besoin sous réserve d’enrichir leurs fonctionnalités traditionnelles (acquisition, traitement, stockage, diffusion) par des possibilités d’élaboration collective de contenu et de partage.

Pour être réellement collaboratif, un outil de GED devra avant tout être simple à utiliser. Les utilisateurs doivent être en mesure de s’approprier et de comprendre le fonctionnement de l’outil facilement sans avoir à déployer un gros effort de formation. Y publier un document doit être une opération simple et rapide afin de favoriser le partage. Le retrouver – grâce par exemple à un moteur de recherche – et le partager avec des collègues doit être tout aussi aisé, tout en garantissant le niveau approprié de sécurité exigé par l’organisation utilisatrice.

Un certain nombre de fonctionnalités vont permettre une collaboration effective entre les utilisateurs en favorisant l’échange et le partage d’informations et d’idées :

  • La notification : elle permet de prévenir un utilisateur ou un groupe d’utilisateurs de la publication d’un document dans l’outil ;
  • La co-rédaction : elle permet à la personne publiant un document de donner des droits de modification à un autre utilisateur ou à un groupe d’utilisateurs qui deviendront co-rédacteurs du document ;
  • Le commentaire : permet de contribuer à la base documentaire par des commentaires ou des notes plus ou moins élaborés permettant l’enrichissement du contenu ;
  • La discussion instantanée ou « chat » : elle permet aux utilisateurs connectés d’échanger des idées, des commentaires ;
  • Les fils de discussion ou « micro-blogging » : sur le modèle des réseaux sociaux, cette fonctionnalité permet de donner en quelques mots un avis, un commentaire, un point-de-vue sur le contenu d’un document ou d’une publication.

 

Pourquoi mettre en œuvre une GED collaborative ?

La raison la plus évidente est de permettre un accès et un échange sûr et contrôlé à des documents de référence qui doivent servir au travail quotidien d’une équipe, d’un service ou d’un département, en évitant les duplications de documents, sources d’erreurs aux conséquences plus ou moins importantes. Mais il faut aussi considérer que la partage et la simplicité d’accès à l’information peuvent devenir une source de gains financiers non négligeables (voir l’article Le coût du temps perdu à chercher une information ou un document).

D’autre part, le fonctionnement en « mode projet » est de plus en plus courant et nécessite une mise en place simple et rapide d’espaces de travail collaboratifs tout en se dotant de la capacité à capitaliser et exploiter de manière pérenne la production documentaire du projet.

Par ailleurs, les équipes d’innovation et de recherche et développement ont elles aussi de plus en plus besoin de ce type d’outil. Il est en effet reconnu que c’est du partage et de la confrontation d’idées et d’informations que naissent les innovations, que ce soit en termes de services ou de produits. La capitalisation des documents produits par ces équipes est ici aussi une source de création de valeur pour l’organisation.

D’un point-de-vue organisationnel, le partage d’informations et les outils collaboratifs permettent de décloisonner les silos traditionnels des organisations, en s’affranchissant des limites virtuelles d’une équipe ou d’un service et bien réelles de la géographie et des fuseaux horaires.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno

moteur de recherche linguistique

Comment exploiter des informations non structurées ?

Mieux exploiter des informations non structurées grâce à la technologie

Les modes d’exploitation d’un corpus documentaire non structurée est souvent calqués sur le mode d’exploitation des bibliothèques, c’est-à-dire basés sur un plan de classement.

Or, lorsqu’on travaille dans un univers numérique, on constate les limites d’usage des plans de classement :

  • Les utilisateurs ne maitrisent pas les concepts des plans de classements des documentalistes.
  • Le volume, l’hétérogénéité et la dynamique des informations (évolutions des versions, par exemple) ne se prêtent pas à ces modes de gestion.
  • Les outils numériques offrent bien d’autres moyens d’exploiter ces corpus.

Nous citerons dans cet article quatre approches complémentaires pour mieux exploiter des informations non structurées. Ainsi, on peut réduire l’intérêt et l’importance des plans de classement et permettre de valoriser des informations non structurées :

  • L’indexation intégrale des contenus grâce aux moteurs « morphosyntaxiques, voire sémantiques, s’appuyant sur l’analyse grammaticale des contenus et proposant des recherches en langage naturel bien plus puissantes que les mots clés
  • L’indexation intégrale des contenus par mots clés
  • Le filtrage sur métadonnées (propriétés ou facettes) et/ou plan de classement
  • L’extraction de chaines de caractères (à la « SQL »)

Les avantages & limites de chaque mode de recherche

La recherche en langage naturel

L’analyse grammaticale permet d’adresser toutes les formes d’une même terme (singulier/pluriel, masculin/féminin, conjugaison des verbes…). D’autre part, la prise en compte des liens entre les termes d’un texte (adjectif qualifiant un nom commun) permet d’être bien plus pertinent aussi bien dans l’affichage des résultats que lors d’une recherche ne mots clés.

Elle permet aussi de s’affranchir des mots « non significatifs » qui génèrent du bruit et viennent « polluer » les réponses.

Cette approche réduit le bruit par explicitation de la pertinence des documents trouvés, évitant ainsi à l’utilisateur d’avoir à consulter des documents peu pertinents.

Dès lors qu’on ajoute des « couches » sémantiques à cette approche, par exemple via la mise en œuvre de « synonymes » (au sens large) des mots de la question, on réduit aussi le silence en permettant d’accéder à des documents parlant effectivement du sujet qui nous intéresse mais sur la base d’autres mots que ceux de sa question.

Les limites sont celles liés à l’analyse grammaticale. Par exemple les signes de ponctuation sont traités comme tels et les mots « codifiés » en contenant comme une référence normalisée (abréviation…) ne pourra être trouvée facilement.

Recherche langage naturel

La recherche par mots-clés

Ce mécanisme s’intéresse aux chaines de caractères (et à leurs fréquences la plupart du temps, voire à leur proximité topographique dans les textes). Tous les mots (chaines) de la question sont recherchés, ce qui impose de parler avec des mots clés, sans syntaxe, et de laisser de côté la signification précise de sa question.

La couche sémantique (synonymie, pluriels, conjugaisons et reconnaissance du genre) n’est pas applicable.

Recherche mots-clés

Cas particulier du multilinguisme & du crosslinguisme

L’approche par mots clés, en s’affranchissant de la notion de langue, permet d’interroger un corpus dans quasiment n’importe quelle langue.

La recherche en langage naturel, elle, ne le permet pas, puisqu’elle s’appuie sur l’analyse grammaticale des textes et est donc dépendante de la langue considérée.

Le crosslinguisme permet de s’affranchir quelque peu de cette limitation, puisqu’il permet de trouver des réponses dans d’autres langues que celles de la question, mais il faut disposer d’analyseur grammaticaux de chacune des langues souhaitées.

Ainsi l’approche par mots clés peut-être à la fois un complément pour aller chercher des « mots » particuliers composés de caractères que l’analyse grammaticale va traiter d’une manière inadaptée et pour interroger des corpus rédigés dans des langues non traités par le moteur considéré.

Recherche crosslingue

Le filtrage sur facettes

Dès lors qu’on opte pour une qualification par facettes, c’est-à-dire une forme de classement non basée sur un plan de classement mais sur des propriétés affectées à chaque document, on peut s’appuyer sur ces propriétés en les traitant comme des de filtres de recherche.

Ainsi si l’on a déclaré qu’un document était un compte-rendu et que l’on cherche un compte-rendu, interroger le système en indiquant cette propriété va permettre de réduire le périmètre de recherche et donc le nombre de résultats et ainsi trouver plus simplement le document souhaité.

L’intérêt de cette approche est qu’elle est bien plus simple qu’un plan de classement du terme, et que si les propriétés sont bien adaptées au contexte, elles seront tout à fait intuitives pour les utilisateurs qui pourront ainsi s’en servir simplement sans compétences ni formation particulière.

Mais, comme tout classement, cette qualification demande un effort supplémentaire à l’utilisateur, à l’entrée su système, c’est-à-dire lorsqu’il enregistre un document dans la base. Et que, s’il ne le fait pas, ou s’il se trompe, la recherche filtrée en permettra pas de retrouver le document en question. Le langage naturel, et sa pertinence, peut compenser ce type d’erreur, dès lors que la question posée est suffisamment adaptée, dans le cas de gros volume de documents, pour le retrouver.

La recherche par séquence de caractères ("pattern")

Un dernier mode de recherche, non adapté à de gros volumes, pour des questions de performance, est la recherche dite « SQL », i.e. exploitant les chaines de caractères au sens strict du terme, c’est-à-dire ne traitant non plus des mots, à la façon des mots clés tels que précisé ci-dessus, mais une succession de caractères pouvant être seulement une partie d’un mot. Par exemple vouloir trouver la succession « chai » dans un texte, et donc toutes les occurrences contenant ces 4 lettres, mais pouvant être les mots chaines, chaises, etc.

Cette approche, associée aux opérateurs classiques tels que « contient », « commence par », « se termine par », …)  permet de traiter des cas particuliers.

Elle ne peut être appliquée à de « vrais » corpus documentaires, mais seulement à des parties de ceux-ci, par exemple aux titres ou à des textes courts associés aux documents (commentaires ou descriptions).

Vous souhaitez savoir comment ANT’inno peut vous aider à mieux valoriser vos données non structurées ?

N’hésitez pas à nous contacter via le formulaire ci-dessous.

N’hésitez pas à remplir ce formulaire pour en savoir plus sur ANT’inno