La solution pour sa base de connaissance : DocFetcher

Il y a quelque temps, je chantais les louanges d’Evernote, solution alors ultime pour organiser l’ensemble de mes documents et surtout les retrouver rapidement. Oui mais voilà, c’était sans compter le système de quota mensuel limité d’upload, qui devient rapidement gênant lorsque l’on corrige une simple faute d’orthographe dans le commentaire d’un PDF de plusieurs 100taine de Mo, et qu’on met à jour ce document. Pouf, voilà notre quota d’upload qui part en fumée pour un simple document ! Il faut attendre le mois suivant maintenant !

Le besoin

Mon besoin est toujours le même : comment retrouver facilement un document à partir des quelques mots clés qui, je sais,  le rendent tellement unique ? Et pour simplifier la tâche, ce besoin doit pouvoir être satisfait hors ligne, privilégier la confidentialité de mes documents, et permettre une sauvegarde. Enfin, il ne doit pas nécessiter l’installation d’un logiciel requérant les droits administrateurs. Hum …

On aimerait tous un Google-like, qui allierait l’ergonomie à l’efficacité. Evernote, Mendeley Desktop, un wiki en ligne permettent de remplir ce besoin mais … Mais ne remplissent pas le besoin de confidentialité et/ou de l’accès hors ligne. Enfin, si la recherche Windows correctement paramétré le permet (en rajoutant l’indexation de pdf), il est impossible d’indexer le contenu de clef USB ou disques durs externes. Impossible d’embarquer sa base de connaissance avec soi.

La solution

Après de nouvelles recherches et de nombreux tests, j’ai découvert une nouvelle solution diablement efficace : DocFetcher. Il s’agit d’une application open source très robuste, qui existe depuis 2013 avec un rythme d’au moins une nouvelle version tous les 6 mois. Elle est disponible pour Windows, Linux (dans les repo officiels) et Mac. Et une version portable existe !

Les fonctionnalités

Doc Fetcher vous permet d’indexer le contenu de nombreux fichiers, et de constituer une petite base de données locale pour des recherches rapides. Il fonctionne sans installation, peut tourner sur une clef USB, même si celle ci change de lettre de montage d’un ordinateur à l’autre. Et surtout, il donne accès à la recherche dans le texte des fichiers PDF !

Mode d’emploi – installation

  1. Tout d’abord, téléchargez l’applicatif sur le site officiel : http://docfetcher.sourceforge.net/. Préférez la solution portable pour une installation sur clef USB.
  2. Dézippez le tout et copier dans un répertoire de votre clef USB : ce répertoire ne pourra plus être changé par rapport aux données que vous allez indexer. En effet, DocFetcher va repérer les fichiers par rapport à ce répertoire. Si vous le bougez, pas de panique, vous devrez juste réindexer votre contenu (ce peut être toutefois un peu long).
  3. Ouvrez le logiciel et ouvrez le menu suivant avec un clic droit dans la zone Contexte de la recherche.DocFetcher2
  4. On commence par choisir quel dossier on va indexer : on peut alors choisir un dossier sur la même clef USB.DocFetcher3
  5. On arrive alors dans une fenêtre de configuration de la recherche. On peut laisser tout les paramètres par défaut, à l’exception de l’avant dernière option qui propose de stocker les chemins en relatif. On coche cette option. Cela permettra d’avoir accès à nos fichiers depuis DocFetcher quel que soit la lettre assignée au lecteur USB. Et donc de pouvoir utiliser cette solution sur plusieurs ordinateurs. On clique alors sur démarrer:DocFetcher5
  6. L’indexation est en cours. Elle ne sera à réaliser qu’une fois, et à mettre à jour de temps en temps pour prendre en compte de nouveaux documents. Cela consiste à récupérer le texte de l’ensemble des documents pour permettre de future recherches rapides. Quelques fichiers peuvent causer des erreurs pendant l’indexation, à cause d’une trop grande taille, ou autres raison. C’est assez rare et rarement gênant:DocFetcher6
  7. On peut alors fermer cette fenêtre et fermer le logiciel. Notre base de connaissance est prête à être utilisée !

Mode d’emploi – utilisation

La recherche grâce à DocFetcher est assez simple, mais quelques fonctionnalités avancées vous permettront d’en tirer meilleur profit.

  • Pour une recherche simple, tapez vos mots clefs séparés par un espace dans la zone de recherche et cliquez sur le bouton recherche. Les résultats apparaissent instantanément en dessous, triés par pertinence. Un clic sur la ligne de résultat qui vous intéresse donne un aperçu du fichier pour les formats supportés avec les mots clefs surlignés en jaune. Un double clic ouvre le fichier dans le programme approprié.
  • Pour une recherche plus avancée, DocFetcher utilise la syntaxe fournie par Apache Lucene. On retrouve dans la documentation (à l’ouverture de DocFetcher) quelques informations résumées ici :
Syntaxe de recherche Renvoie les documents qui contiennent
chien chien ou chiens ou chienne ou …
chien OR chat chien, chat, ou les deux
chien AND chat chien et chat
chien chat chien, chat ou les deux
chien NOT chat chien, mais pas chat
(chien OR chat) AND souris souris, et chien, ou chat, ou les deux
« chien chat souris » les mots chien chat souris dans cet ordre
+chien chat surtout chien, mais pourquoi pas chat aussi
chien^4 chat^2 souris surtout chien, chat dans une moindre mesure, et peut être souris
« chien chat » AND souris les mots chien et chat dans cet ordre et aussi souris n’importe où
luc? lucy, luca, …
luc* luc, lucy, luck, lucene, …
*ene* lucene, energy, generator, …
tente~ tente, tante, tonte, …
« chat chien »~10 chat et chien à maximum 10 mots d’écarts

En plus de répondre à toutes nos exigences, voici un logiciel prometteur, avec un bon rythme de développement, et reposant sur des technologies intéressantes. Pour ma part, il est adopté. Ma clef USB avec ma biblio, les articles de presse et mes différentes notes a dorénavant DocFetcher d’installé. Si un texte m’a marqué, je suis dorénavant sûr de le retrouver n’importe où, à n’importe quel moment !

 

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *