OLAP
Les systèmes OLAP sont des processus analytiques qui permettent d’extraire et de visualiser de manière sélective des jeux de données et de leur appliquer assez facilement différents points de vue.
Par exemple, un analyste employé par un producteur de jouets pour l’extérieur pourra faire une requête sur certaines données de son entreprise pour obtenir le tableau des ventes de ballons de plage, sur la région PACA, en juillet. Puis les comparer avec ces mêmes ventes mais sur le mois de septembre. Puis les comparer avec les ventes des autres produits du catalogue sur la même période de juillet.
Pour faciliter ce type d’analyse, les données sont stockées dans une base dite multidimensionnelle, un cube OLAP.
On peut schématiquement considéré qu’une base relationnelle classique est une base à deux dimensions. Une base multidimensionnelle considérera chaque attribut (produit, région géographique, période, etc.) comme une dimension séparée.
Les systèmes OLAP sont conçus pour repérer les intersections entre ces multiples dimensions (ce qui revient par exemple à déterminer tous les produits, vendus en Bretagne, en dessous de X euros, pendant les trois mois de printemps). Elles peuvent également diviser des attributs – comme une saison – en sous-attributs – en mois ou en semaines.
Les systèmes OLAP sont historiquement utilisés dans la BI en général et dans le data mining en particulier.
Un cube OLAP se nourrit souvent des données d’un Data Warehouse mais il peut ne pas être aussi important en taille que cette source, dans le sens où une analyse OLAP n’a pas besoin de traiter la totalité des données transactionnelles pour déterminer des tendances.
Les données peuvent également être importées de différentes bases séparées – relationnelles voire NoSQL (lire « Entrepôts de données multidimensionnelles NoSQL » de l’Institut de Recherche en Informatique de Toulouse) - pour créer une base multidimensionnelle adapatée aux systèmes OLAP.