1. La problématique DONNÉES:Problématique
Excel peut tout faire, mais il souffre tout
de même d’une limitation : celle sur
la taille des données. Longtemps, Excel a été confiné à l’étude
de 255 colonnes et de 65 000 lignes sur une feuille. Les
versions récentes ont relevé cette dernière
valeur à 1 000 000 de lignes. Toutefois,
ceci n’est pas suffisant pour des analyses de données
qui se comptent sur plusieurs millions d’individus.
Ainsi, il est impossible de réaliser
une analyse des impôts sur les revenus de tous les foyers fiscaux
français sur une feuille Excel, ou bien de lister tous
les achats réalisés sur dix ans sur telles plates-formes
de boutique en ligne…
Même lorsque les résultats
restent limités aux possibilités d’Excel,
les forts volumes posent des problèmes de performances,
et ceci n’est pas limité à Excel. Les
bases de données elles aussi peuvent réaliser
des calculs simples sur quelques millions de lignes de données, mais
dès lors que les analyses n’utilisent plus les
index, ou sont tellement complexes qu’elles empêchent
les optimisations de ces logiciels de fonctionner correctement,
les temps de traitement sont fortement dégradés.
Or, les décideurs veulent des résultats
de plus ...