Forum Archives ICFO

Les archives de l'Institut canadien-français d'Ottawa

Vous n'êtes pas identifié(e).

#1 2020-11-10 16:50:52

admin
Administrator
Inscription : 2020-11-09
Messages : 15

Fonctionnement du moteur de recherche

La recherche dans les documents numérisés n'est pas chose simple, principalement avec les anciens journaux où la qualité d'impression n'est pas suffisante.

La reconnaissance optique de caractères a de la difficulté à reconnaître tous les caractères correctement et cause beaucoup d'erreurs. Parfois les mots peuvent écrits différemment selon l'auteur. Balsora peut-être écrit Balsara, Balzora. L'utilisation d'initiale dans les noms. J. B. Turgeon au lieu de Joseph Balsora Turgeon. La lettre d devient cl, un e devient un c, etc.

Pour ces raisons nous avons utilisé une méthode de recherche par proximité. C'est-à-dire que les espaces dans le terme recherché sont remplacés par un éloignement de 0 à 50 caractères. Par défaut, la valeur est de dix.

Par exemple, si vous cherchez Joseph Balsora Turgeon et entrée J B Tur, le moteur de recherche cherchera pour J et ensuite à l'intérieur des prochains 10 caractères, le B, puis à l'intérieur des 10 prochains caractères, Tur.

Chaque entrée dans la base donnée consiste d'un Titre, Date, Résumé/Extrait. Également l'entièreté de la page ou des pages sont enregistrées dans la base de données, ce qui n'est pas visible sur le site. C'est cette dernière qui est utilisée par le moteur de recherche et affichera le résultat dans la recherche en surlignant les mots recherchés.

Hors ligne

Pied de page des forums