Bannière de la cartothèque.
Informations - Recherche documentaire

Un bref vocabulaire de la recherche documentaire

Annuaires
Parfois nommés répertoire Internet. Ce sont des sites de liens pointant vers des ensembles de références documentaires, jugées dignes d’intérêt ou de qualité par la personne ou l’institution qui le produit. A la différence des moteurs de recherche, il s’agit alors d’une indexation humaine.

Bruit
Le bruit souvent est le produit de l’inadéquation entre le souhait de l’utilisateur et le mode d’indexation. Un nombre trop grand de réponses inappropriées contribue à masquer les réponses pertinentes en saturant l'utilisateur d’informations. Définir une requête en adéquation avec les mots clés utilisés pour l’indexation est en conséquence un impératif.

Document primaire, secondaire et tertiaire
Un document original, qui n’a subi aucun traitement particulier (ex : un roman) est un document primaire.
Un document composé de métadonnées présentant un autre document, comme une fiche de bibliothèque signalant un ouvrage est un document secondaire.
Un regroupement structuré de documents primaires et/ou secondaires, comme une bibliographie analytique ou un dossier documentaire est un document tertiaire.

Indexation
L’indexation d'un texte consiste à repérer dans celui-ci certains mots ou expressions particulièrement significatifs (appelés termes) dans un contexte donné, afin de créer un index terminologique. Elles sont de deux types : humaine, si réalisées par des personnes ou des institutions, ou logicielle si cet indexation est réalisée par des bots

Métamoteurs
Ce sont des applications qui interrogent différents moteurs de recherche et en proposent une synthèse structurée (par exemple en supprimant les références multiples liées à un même site).
On retiendra parmi eux Copernic qui est un site européen, IxQuick et Scroogle pour la préservation de la confidentialité de l’utilisateur ou encore Creative Commons search pour des recherches en fonction de la liberté de réutilisation des données accordées à l’utilisateur.

Moteurs de recherche
Une application en ligne effectuant une indexation de pages Web sans intervention humaine à l’aide de logiciels appelés bots. Cette application permet d’effectuer des recherches sur la base de mots-clés.
Certains sont généralistes (tous types de documents), comme Yahoo, Google, Bing ou encore Altavista. D’autres sont spécialisés dans le niveau d’information dispensé, tels Google Scholar ou Scirus pour l’information de type universitaire. D’autres enfin sont spécialisés dans par type de document indexé, comme Flick’R pour les images ou Technocrati pour les blogs.

Plagiat
Le plagiat est l’action de s'inspirer d'un modèle que l'on omet de désigner, de manière volontaire ou non. Il est passible de poursuites pour non respect du droit d’auteur et de la propriété intellectuelle.

Recherche Booléenne
La recherche booléenne est l’application des équations du mathématicien anglais George Boole au domaine de la recherche d'information. Elle peut servir dans de nombreux moteurs de recherche comme dans l’ensemble des bases de données. La recherche booléenne est composée de 4 éléments (AND/ET, OR/OU, NON/PAS/NOT et NEAR). Les différentes combinaisons de ces quatre termes permettent de cerner le sujet au plus près des souhaits de l’utilisateur.

Silence
Le silence est l’absence de réponse lorsque celles-ci existent. Il convient bien souvent de changer les termes de sa recherche afin d’identifier les synonymes qui pourraient apporter une réponse.
Par exemple : Je recherche, dans le cadre d’un travail portant sur le moyen-âge, le mot « Viking » et j’obtiens des réponses sur les missions spatiales de la NASA. Il convient alors d’utiliser les mots Normands, Nothmen, etc… afin de vérifier si les documents que je recherche ne sont pas plutôt indexés à ces entrées.

Félix Poyer - juin 2011