Edelweiss - Fotolia
La multiplication des sources complique l’intégration de données (étude)
L’intégration multi-sources, mêlant bases de données relationnelles, NoSQL, systèmes Big Data et applications Saas compliquent la tâche des entreprises qui se reposent de plus en plus sur l’exploitation des données.
Avec la montée en puissance du Saas dans les entreprises et la présence toujours très forte des bases de données relationnelles sur site, les entreprises font face à un problème grandissant d’intégration de données, révèle la 4e édition de l’étude « 2017 Data Connectivity Outlook » menée par l’éditeur Progress. Cette étude a été réalisé auprès de 1 200 personnes, de profils IT et métier – dont 38% de répondants dans la zone EMEA.
L’un des faits marquants est la prolifération des sources de données auxquelles les entreprises sont aujourd’hui confrontées. En cause, l’explosion des données certes, mais également la volonté des entreprises de les exploiter pour mieux orienter leurs activités, accélérer la prise de décision ou créer de nouveaux de leviers de revenus et de croissance.
Sans trop de surprise, les bases relationnelles « traditionnelles » sur site restent encore la source principale. Dans ce cadre, SQL Server est cité dans 63% des cas, MySQL (45%) et Oracle (44%) suivis de loin par SQL Azure (24%), PostgreSQL et Access (22% tous les 2) et IBM DB2 (17%).
Le Saas, une source de données qui monte
Mais dans ce schéma interviennent désormais des services Saas, de plus en plus présents dans les entreprises. Entre 2016 et 2017, souligne encore l’étude, l’adoption du Saas est passée de 62% à 79%. Plus de 50% des répondants accèdent à 2 ou plus services Saas, 35% 3 ou plus. Logiquement, cette progression du Saas est alimentée par des outils de CRM, HCM, marketing ou bureautique. A 43% il s’agit d’Office365, 29% Google Analytics, 24% Salesforce, 18% Microsoft Dynamics CRM et 13% Paypal – pour ne citer que le Top 5.
Et à dispositif, les entreprises y associent désormais des interfaces pour manipuler des données jusqu’alors peu prises en compte – comprendre les données en volume ou Big Data. Pour ces modèles-ci, les entreprises ont donc inclus une énième source : A 25% il s’agit de Hive, 13% SparkSQL, suivis d’Hortonworks, Cloudera et Impala à 9%. Au total, la connectivité aux sources dites Big Data a progressé de 11% entre 2016 et 2017, rapporte Progress dans son étude.
Par effet de levier, les bases dites NoSQL ont-elles-aussi évolué dans les SI des entreprises, 50% des répondants affirmant en posséder. MongoDB, à 29%, est la plus citée, devant Cassandra (12%), HBase (8%), Oracle NoSQL (7%) et Redis (7%).
Une vue unifiée de plus en plus difficile
Dans ce contexte, Il est difficile de connecter l’ensemble pour avoir une vision unifiée des sources de données, explique l’étude. Et difficile aussi de relier ces précieux indicateurs aux outils de reporting et d’analytiques convoités par les entreprises. C’est ce que pensent 49% des répondants pour qui la multiplication de sources constitue une vraie difficulté en matière d’intégration. Pour 41%, la difficulté est d’intégrer les données issues du Cloud à celles stockées dans l’entreprise. La protection des données est ici la principale crainte.
Pour 38% des répondants, le problème vient de la variété des données (structurées ou non structurées), 32% citent le volume des données et 20% la vélocité des données. L’intégration des flux des données (Streaming) représente une difficulté pour 18% alors que la qualité des données seulement 14%.
Logiquement, pour relier ces sources de données et en favoriser l’accès, les entreprises interrogées privilégient aujourd’hui les standards, révèle enfin cette étude. A 64%, ODBC est cité et JDBC à 50%. REST est utilisé par 55% des entreprises sondées ; OData 16%. Enfin, il est à noter que SOAP est encore exploité par 55% des répondants.