Sommaire

Exemple : utiliser DBpedia en Python DBpedia

DBpedia est une extraction automatique de données structurées, dérivées de l’encyclopédie libre et ouverte Wikipédia. DBpedia contient notamment les relations entre les pages Wikipedia, mais aussi des données plus spécifiques, comme la date de naissance des personnes figurant dans Wikipédia. Une ontologie OWL structure l’ensemble des données. Il s’agit donc d’un jeu de données généraliste orienté « culture générale ». La version la plus récente date d’octobre 2016 et peut être téléchargée à l’adresse suivante : https://wiki.dbpedia.org/develop/datasets/downloads-2016-10. DBpedia est composé de plusieurs fichiers (voir copie d’écran du site web ci-dessous) : la partie ontologie proprement dite, à télécharger au format OWL (fichier dbpedia_2016-10.owl) et les données, à télécharger au format TTL (équivalent à NTriples) dans leur version canonisée (canonicalized, noté « ttl* » sur le site de DBpedia). Plusieurs langues sont disponibles, nous allons travailler avec la version anglaise.

images/p98.png

[...]

images/p98_2.png

1. Charger DBpedia

DBpedia étant très volumineux, tous les fichiers ne sont pas utilisés d’ordinaire. Le tableau suivant en liste les principaux, que vous pouvez télécharger (attention, ...