Blog ENI : Toute la veille numérique !
🐠 -25€ dès 75€ 
+ 7 jours d'accès à la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Faire de la veille
  3. Rechercher de l’information sur le Web
Extrait - Faire de la veille Collecter, traiter, analyser et diffuser l'information (2e édition)
Extraits du livre
Faire de la veille Collecter, traiter, analyser et diffuser l'information (2e édition) Revenir à la page d'achat du livre

Rechercher de l’information sur le Web

Introduction

Les moteurs de recherche sont aujourd’hui des outils incontournables pour trouver simplement et rapidement des informations pertinentes sur le Web. Ils sont également omniprésents dans les activités de veille et notamment pour :

  • le ciblage, afin de tester le plan de veille, identifier de nouveaux mots-clés, prendre rapidement connaissance d’un domaine peu ou pas connu, etc. ;

  • le sourcing, pour trouver de nouvelles sources d’information ;

  • la collecte, pour identifier manuellement des informations potentiellement pertinentes ;

  • le traitement, pour trouver des informations permettant de recouper et qualifier celles qui ont été collectées automatiquement.

Il est donc important dans le cadre de la veille de bien comprendre le fonctionnement des moteurs de recherche, de savoir lesquels utiliser et dans quels cas, mais aussi et surtout, d’appliquer les bonnes pratiques qui permettront d’en tirer le meilleur parti.

Panorama des moteurs de recherche web

Introduction

La vocation d’un moteur de recherche web est de rendre accessibles et « trouvables » des pages web ainsi que les ressources qui leur sont associées (documents, images, vidéos, podcasts…).

Devenu incontournable, au point d’être, pour certains, le seul moteur de recherche sur le Web, Google est en fait l’arbre qui cache la forêt. En effet, Google, du moins dans son utilisation la plus populaire, n’est que le représentant d’une catégorie de moteurs de recherche web : les moteurs de recherche généralistes. Il en existe d’autres : métamoteurs, moteurs de recherche verticaux ou spécialisés…

Mais avant de dresser un panorama des moteurs de recherche web disponibles et des méthodes pour les utiliser au mieux, il est nécessaire de s’arrêter quelques instants sur leurs grands principes de fonctionnement afin de mieux cerner leurs forces et leurs faiblesses, notamment dans le cadre d’une activité de veille.

Bien souvent, lorsque l’on évoque les moteurs de recherche web, les annuaires sont également cités. Ces derniers sont d’excellents outils de recherche dans la mesure où ils référencent des sources qui ont été identifiées à la suite d’un traitement manuel. Cependant, leur mode de fonctionnement est très différent des moteurs de recherche et ne seront pas présentés ici. Très utiles à la veille, ils seront abordés dans le chapitre suivant consacré au sourcing.

Fonctionnement d’un moteur de recherche sur le Web

Grands principes

Un moteur de recherche web repose généralement sur trois grandes fonctions :

  • Le crawling, qui consiste à identifier et collecter des données sur les contenus disponibles sur le Web et que l’on souhaite rendre accessible via une recherche.

  • L’indexation, qui vise à extraire les informations les plus importantes de ces contenus.

  • Et l’appariement, qui permet de présenter une liste de résultats jugés pertinents par rapport à une recherche.

Les trois grandes fonctions d’un moteur de recherche web

Les trois grandes fonctions d’un moteur de recherche web

Crawling

Pour remplir pleinement leur rôle, les moteurs...

Choisir le ou les moteurs de recherche adaptés à votre besoin

Définir votre besoin

Rien ne sert de se lancer tête baissée dans une recherche d’information sur le Web en effectuant de multiples requêtes sans avoir pris quelques minutes pour bien définir votre besoin et délimiter le périmètre de votre recherche.

Pour trouver rapidement et de manière efficiente les informations recherchées, il est indispensable d’avoir en tête les réponses aux questions suivantes :

  • Quel type/format d’information rechercher ?

  • Sur quel(s) domaine(s) particulier(s) focaliser la recherche ?

  • Sur quel(s) périmètre(s) géographique et linguistique ?

  • Sur quelle(s) période(s) de temps ?

Les réponses obtenues aux questions précédentes vont permettre de sélectionner le ou les moteurs de recherche web les mieux adaptés aux besoins.

Sélectionner les bons moteurs de recherche

Le choix par défaut est celui d’un moteur de recherche généraliste. D’ailleurs, même s’il est orienté grand public, vous pouvez tout à fait utiliser avec succès Google pour faire de la veille sur des sujets très pointus. Cependant, l’utilisation d’un moteur de recherche vertical, de manière exclusive ou en complément d’un moteur...

Créer son propre moteur de recherche personnalisé

Si aucun moteur de recherche généraliste ou spécialisé ne vous convient, vous avez la possibilité de créer votre propre moteur de recherche grâce par exemple au service Programmable Search Engine de Google.

Avant de démarrer la création d’un moteur de recherche personnalisé, il est nécessaire d’identifier en amont les sites web sur lesquels vous souhaitez cibler la recherche. Sans cette liste, vous ne pourrez pas créer votre moteur de recherche.

Si vous souhaitez mettre en place un moteur de recherche « concurrentiel », il vous faudra par exemple identifier et répertorier l’ensemble des sites web de vos concurrents. Puis les paramétrer dans l’outil de manière à limiter le moteur à votre univers concurrentiel. 

Le chapitre Travailler avec des sources d’information sur le Web est entièrement dédié à cette problématique d’identification de sites web.

Pour rendre les choses concrètes, nous allons voir comment créer un moteur de recherche personnalisé avec Programmable Search Engine.

 Tout d’abord, accédez au site du service Google : https://programmablesearchengine.google.com/

Page d’accueil de Google Programmable Search Engine...

Page d’accueil de Google Programmable Search Engine...

Adopter les bonnes pratiques de la recherche d’information sur le Web

Une fois le choix du ou des moteurs de recherche à utiliser, vous pouvez alors procéder à la recherche d’information. Mais pour mener à bien une recherche d’information sur le Web dans les meilleures conditions, il est recommandé de suivre différentes bonnes pratiques que nous allons présenter ci-dessous.

S’assurer de la « neutralité » du moteur de recherche utilisé

Certains moteurs de recherche, comme Google, s’appuient sur le profil de l’utilisateur afin de lui fournir des résultats pertinents. Malheureusement cette personnalisation peut entraîner l’utilisateur dans une bulle de filtre, ce qui peut être pénalisant dans le cadre d’une activité de veille.

Afin d’éviter cela, il est essentiel de « dépersonnaliser » le moteur de recherche utilisé. Par exemple pour Google, cela passe en premier lieu par le fait de se déconnecter de son compte.

Mais ce n’est pas toujours suffisant. En effet, d’autres éléments sont parfois pris en compte comme l’adresse IP. L’utilisation de la géolocalisation permet à certains moteurs de recherche, tels que Google, de proposer des résultats en rapport avec cette géolocalisation. On parle alors de recherche de proximité. Par exemple, si vous effectuez une recherche sur des sociétés, Google utilisera les données de géolocalisation pour proposer les sociétés les plus proches répondant à la requête.

À titre d’information, voici les éléments pris en compte par Google pour déterminer votre position lorsque vous effectuez une recherche :

  • la position de votre appareil ;

  • vos adresses avec libellé ;

  • l’adresse que vous avez définie dans l’application Google Home pour votre enceinte, votre écran connecté ou votre réveil connecté ;

  • votre activité précédente dans l’ensemble des produits Google ;

  • votre adresse IP, obligatoire pour utiliser Internet.

Pour rendre Google le plus « neutre » possible, sans pour autant être sûr d’y parvenir totalement, il...