top of page
  • Christophe COUPEZ

Le moteur de recherche d'entreprise


Le concept d'intranet est né il y a 15 ans : à cette époque, l'intranet c'était un seul site web, la page d'accueil "Corporate" de l'entreprise, avec un outil de publication des articles à l'attention des collaborateurs. Facile d’y trouver une information. Le déploiement des outils métier en mode web, puis les outils collaboratifs (SharePoint) a considérablement augmenté le périmètre, intégrant les documents, et toutes sortes d'autres informations qui étaient avant cela bien cachées au fond des serveurs de fichiers. On a alors commencé à parler "d'infobésité" et on s'est posé une question qu'on ne s'était jamais posée jusque-là : « comment permettre aux collaborateurs de retrouver l'information ? ». C'était la grande époque du knowledge management. L'avènement du Réseau Social d'Entreprise a apporté une nouvelle dimension à la problématique de la recherche d'entreprise. Recherche d'entreprise : tel est le sujet de ce billet. Le périmètre de recherche Le champ de recherche d'un éventuel moteur d'entreprise est vaste. La question qui se pose rapidement à toute personne missionnée pour le mettre en place est : « à partir de où ce moteur doit-il commencer à chercher, et où doit-il s'arrêter » ? Par exemple, est-ce que certains des outils métier Web qui contiennent des informations structurées sont concernés ? Ça serait bien utile, en cherchant certains mots, de tomber sur des infos gérées par un outil métier car l’information n’est pas que dans des documents bureautiques. Mais l'intégration des outils métier dans le périmètre de la recherche n'est pas forcément simple, car tous ces outils ne sont pas forcément prévus pour être "crawlés" par un moteur, ni pour exposer ses résultats de façon lisible. Il y a également des questions de règles d'accessibilité aux informations (gestion des droits), qui reposent souvent sur des mécanismes propres à l’application, sur lesquels le moteur peut difficilement s’appuyer. Prenons quelque chose de plus simple : par exemple, SharePoint, produit plus connu pour ses fonctionnalités de GED que ses fonctionnalités collaboratives. Oui, sauf qu'il y a souvent plusieurs milliers sites SharePoint dans l'entreprise. Certains sont pertinents et actualisés, d'autres sont "morts" (avec des données obsolètes ou pas, allez savoir). Certains de ces sites sont des sites SharePoint "métier", d'autres des sites 100% documentaires avec des centaines de documents. Mais tous sont-ils pertinents ? Plus compliqué : tous ces sites n'intègrent pas des données forcément utiles. Par défaut, SharePoint positionne à "oui" par défaut l'indexation de toutes les listes de données (documents ou autres). De sorte qu'un moteur qui "crawlerait" tous les sites remonterait tout, y compris des données provenant de listes sans aucun intérêt. Par exemple, dans certains de mes sites, je me fais parfois des listes "copie" pour mettre à l'écart des versions avant modification : faut-il que ces documents par définition non finalisés remontent aux utilisateurs ? Le Réseau Social d'Entreprise apporte une nouvelle couche à la problématique de la recherche d'entreprise. Il apporte les flux d'échange (ce qui n'existait pas jusque-là), les profils des collaborateurs, ainsi que d'autres informations qu'on pouvait aussi trouver dans d'autres sites SharePoint (comme les billets de blog, etc). Le tour d'horizon n'est pas terminé : il y a encore les informations de l'annuaire d'entreprise, les mails des collaborateurs, qui contiennent une grande partie de l'information. Ce sujet est vaste et large, et il dépasse largement le simple choix d'un outil. Et la confidentialité ? Mettre en place un (vrai) moteur de recherche d’entreprise, c’est comme construire une autoroute qui va conduire en ligne directe les utilisateurs vers toutes les sources de données et d’information de l’entreprise, en plaçant des panneaux indicateurs vers les sources les plus pertinentes. Le moteur de recherche permet de rendre accessibles et visibles tous les contenus de l’entreprise (en tout cas, ceux qu’indexe le moteur de l’entreprise). On peut se dire que personne n’a rien à cacher, il y a bien sûr des sujets dans l’entreprise qui sont confidentiels, comme la préparation de nouvelles offres commerciales, ou de nouveaux produits. Un moteur de recherche s’appuie bien évidemment sur des mécanismes de sécurité, qui permettent de ne remonter à l’utilisateur que les contenus pour lesquels il dispose des droits de lecture suffisants. Mais que se passe-t-il si le responsable d’une source de contenus gère mal (ou pas du tout) cette confidentialité ? Sans moteur de recherche, les sources d’information et de documents en ligne ne sont pas publiquement « exposés » aux utilisateurs : il n’y a pas cette autoroute qui vous y conduit directement. De sorte que si le site est mal protégé, aucun moteur n’expose cette erreur de confidentialité. Avec un moteur, c’est bien différent. Même sans chercher à percer les secrets de l’entreprise, au détour d’une recherche banale, un contenu confidentiel mal protégé peut vous être proposé. Ne pas disposer de moteur d’entreprise ne protège pas les secrets de l’entreprise s’ils sont mal protégés, mais cela évite de tracer un boulevard aux petits curieux qui s’y intéresseraient de trop près. Il y a donc un positionnement clair à prendre vis à vis des données de l'entreprise. Pour qu'un moteur d'entreprise soit "global" à toute l'entreprise. A cause des risques décrits ci-dessus, doit-on le faire de manière concerté avec les responsables des contenus, ou pas ? Pour SharePoint, doit-on décider que tous les sites SharePoint sont forcément indexés par défaut par le méta moteur de recherche, ou au contraire laisser le libre choix aux administrateurs des sites SharePoint de les ouvrir au moteur de recherche d'entreprise ? Un projet d'entreprise Mettre en place un moteur de recherche d'entreprise, c'est un projet ... d'entreprise, avec une définition claire des rôles et des responsabilités. Pour le coup, plus que jamais, il y a une stratégie à définir, des orientations à prendre, des choix à faire, une vraie volonté et un accompagnement important. Définir clairement l'objectif du moteur, mais surtout son périmètre, c'est un point essentiel. Définir par exemple si tous les sites SharePoint doivent être intégrés de gré ou de force dans le périmètre, c'est une sacrée responsabilité que quelqu'un doit assumer, mais qui ? Faire la cartographie des contenus de l'entreprise, étudier les sources d'information, auditer les responsables, identifier les sites confidentiels, ou ceux qui sont pertinents pour l'entreprise, c'est aussi une tâche à réaliser en amont, qui est très importante. Faire de l'accompagnement aux "éditeurs de contenu", les informer de la mise en place d'un "méga moteur de recherche" qui pourrait exposer leurs contenus à toute l'entreprise, les sensibiliser à la maîtrise de la confidentialité, des bonnes pratiques documentaires (tags, …), c'est essentiel. Ce n'est pas un boulot d'informaticien, mais plus de documentaliste. D'ailleurs, les grands comptes qui ont un moteur de recherche d'entreprise qui fonctionne bien possèdent souvent au moins une personne ayant ce rôle, à temps partiel ou à temps plein. Moteur d'entreprise et gouvernance Déployer un moteur de recherche d’entreprise (un vrai), c'est 30% de technique (une solution, un moteur, ...) et 70% de gouvernance et d'administration. Faire l'un sans l'autre, c'est non seulement une perte de temps mais c'est aussi potentiellement dangereux en termes de confidentialité, et en termes d’efficacité. A titre d’exemple, les possibilités offertes par le moteur de SharePoint 2013 sont extrêmement étendues. L'administrateur du moteur peut gérer des dictionnaires de taxonomie pour donner plus de poids à certains mots. Il peut donner plus de "poids" à certains sites plutôt qu'à d'autres pour faire remonter certaines réponses avant d'autres, ou au contraire, donner moins de poids à d'autres sites. L'administrateur peut également gérer des listes de "proposition de recherche" pour guider l'utilisateur… Garantir l'efficacité du moteur de recherche d'entreprise, c'est donc régulièrement investir de temps en investigation : quels sont les nouveaux sites créés, quels sont les sites pertinents? C'est également un vrai investissement en gouvernance des contenus, qu'il s'agisse des sites SharePoint, des Communautés du RSE, ou de tout autre contenu "branché" sur le moteur d'entreprise : l'objectif est de faire la chasse aux sites pollueurs, ceux qui contiennent des informations obsolètes (voir même fausses) qui vont noyer les utilisateurs dans une masse de réponses complètement inutilisables. Car le but du moteur c’est de rendre les collaborateurs plus efficaces, pas des les induire en erreur. Pour les raisons évoquées précédemment, auditer la sécurité des sites est primordiale : à partir du moment où vous prenez la responsabilité de rendre tous les contenus de l'entreprise potentiellement accessibles par tous les utilisateurs, vous devez vous assurer que tous les responsables des contenus comprennent leur responsabilité et gèrent correctement le positionnement des droits. Sinon, c’est le responsable du moteur qui sera tenu pour responsable des fuites d'informations aux yeux du management, pas l’éditeur du contenu mal protégé. L'administration d'un tel moteur est une charge importante, et régulière. Bien sûr, on peut s'en passer et poser le moteur de recherche "out the box" sans se soucier de tous ces sujets, mais ce ne serait pas une très bonne idée, vous avouerez. Qui doit gérer le moteur de recherche ? Comme je l'ai expliqué, mettre en place un moteur de recherche n'est pas le plus grand travail en soi. Le plus gros travail, c'est de définir la stratégie, le périmètre du moteur, d'auditer les contenus, et ce n'est pas à proprement parler un travail d'informaticien. Par la suite, il faut réaliser l'accompagnement des responsables des sites pour leur expliquer leurs responsabilités, les conseiller... Il faut faire les actions de gouvernance dont je parlais juste avant, ainsi que les audits de sécurité. Il faut également assurer le paramétrage continu du moteur de recherche. Le travail de l'informaticien s'arrête à l'installation du moteur de recherche. Mais qui, dans l'entreprise, doit assurer tous ces points en amont, et en aval du projet ? Qui a la capacité, les ressources, la volonté et la mission d'assurer cette charge de travail ? Mettre en place un moteur de recherche d'entreprise digne de ce nom, c'est déjà répondre à cette question, et identifier un budget associé à la fois pour la mise en place du projet, et pour ses tâches récurrentes. Quel moteur de recherche ? Régulièrement, j'entends qu'il suffit d'installer la version "Google Entreprise" pour avoir un moteur de recherche efficace. Le contexte d'un moteur de recherche mondial tel que Google, et celui d'un moteur Intranet ne sont pas les mêmes : le premier tire sa pertinence de milliards de données, ce qui n'est pas le cas du second. Dans le second cas, le moteur s’appuie plus sur les « tags » positionnés par les éditeurs des contenus pour améliorer l’efficacité de la recherche, à défaut de disposer de millions de visites pour mesurer la pertinence d’un contenu. Reste qu’il faut que ces tags existent. Le choix du moteur de recherche est une chose ; la manière de le gérer en est une autre. La pertinence d'un moteur dépend beaucoup des données qu'on lui donne pour fonctionner. Les "tags" positionnés sur les documents sont essentiels par exemple pour pouvoir améliorer la pertinence. Mais positionner des tags est une démarche volontaire des utilisateurs ; elle demande de la sensibilisation et de la pédagogie. Voir de la contrainte et de la surveillance. Je ne rentrerai pas dans les détails des différents moteurs de recherche existants, qu'ils soient classiques ou heuristiques. Il y en a de tout type, de tous les prix. Mais quel que soit le moteur de recherche choisi, sans aucune administration ni paramétrage, sans définir ni gérer son périmètre de recherche, je suis persuadé que la différence de pertinence entre les principaux moteurs de recherche modernes existant sur le marché se fera à la marge.

bottom of page