carloscastilla - Fotolia
Entrepôt de données : Google tire une passerelle directe entre Teradata et BigQuery
Google veut accélérer dans l’entrepôt de données et présente un programme de migration vers BigQuery qui cible les utilisateurs de Teradata et Netezza.
Google fait les yeux doux aux utilisateurs des entrepôts de données de Teradata et IBM Netezza. Alors que le géant de Mountain View mène depuis des années une stratégie de conquête des entreprises, le groupe a présenté un programme de migration pour pousser les utilisateurs d’entrepôts de données traditionnels (par opposition à ceux dans le cloud) vers BigQuery. Pour l’heure, ce programme cible les utilisateurs de Teradata et d’IBM Netezza, deux plateformes historiques du secteur, de plus en plus prises à défaut pour leur manque de structuration aux caractéristiques du cloud. Teradata y a certes travaillé (avec IntelliCloud), mais pour les utilisateurs de Netezza, c’est en effet une autre histoire, car IBM a placé au 30 juin 2019 la fin de vie de ses appliances TwinFin et Striper. Ouvrant ainsi une porte à la concurrence.
Et il faut dire que dans ce domaine, la concurrence s’est fortement intensifiée et d’une façon générale, elle vient essentiellement du cloud. Si Google souhaite profiter ici de cette aubaine, AWS y est présent avec RedShift, tout comme Microsoft avec Azure SQL Datawarehouse. D’autres pure-players connaissent actuellement une croissance fulgurante. C’est notamment le cas de Snowflake dont la technologie et le positionnement séduisent à vitesse grand V les entreprises, y compris en France.
Pour Google, il s’agit donc de tirer une passerelle directe depuis ces entrepôts de données sur site vers ses propres services. Big Query constitue ici une porte d’entrée vers l’ensemble des services de traitement et d’analyse des données de Google Cloud.
Ce programme comprend 4 volets qui visent à accompagner l’entreprise, depuis la phase de planification jusqu’au déploiement en lui-même. Au démarrage, si éligibles – pour cela, les entreprises doivent avoir souscrit un contrat BigQuery avec 2 000 emplacements a minima - , les entreprises ont accès à un panel d’experts, des bonnes pratiques afin de leur faire accoucher d’un PoC avec l’aide de partenaires ou de consultants techniques Google. Ce PoC est financé par le programme. Une série de formations en ligne y est également proposée via Google ou encore Qwiklabs ou Coursera.
Puis des ingénieurs Google interviennent dans le projet pour conseiller et personnaliser l’architecture via une série d’ateliers. Enfin, les procédures de migration peuvent être mise en place. Google affirme que les entreprises éligibles peuvent à ce stade recevoir le financement de partenaires pour compenser les coûts d’implémentation.
Pour accompagner ce programme, Google a également adapté son outil de migration BigQuery Data Transfer Service en le dotant d’un agent pour Teradata. Celui-ci transfère les données avec méta-data, schémas ainsi que les tâches d’ETL et autres procédures stockées.
Peu de grands comptes ré-inventent leurs entrepôts de données
Si en effet sur le papier, l’offre de Google peut apparaitre séduisante, elle pose quelques questions quant aux cas d’usage, s’interroge d’ailleurs Doug Henschen, analyste du cabinet d’analystes Constellation Research, chez nos confrères et partenaires de SearchCloudComputing (groupe TechTarget, propriétaire du MagIT). « La vraie question pour les clients existants est de savoir combien ils ont investi dans leur plateforme existante et quelles solutions de rechange ils ont », commente-t-il. Car finalement, changer d’entrepôt de données n’est en rien une opération anodine, reprend-il. Les clients de Teradata et Netezza sont en effet des grands comptes, avec les contraintes de grands comptes. Doug Henschen cite par exemple une entreprise de télécommunications qui gère 2 Po de données réparties sur plus de 100 000 tables. « Le système est interrogé 60 millions de fois par jour et est associé à 50 applications. Cela ne sera pas reconstruit », souligne-t-il.
Pour de telles grandes entreprises, une migration vers le cloud n'est pas économiquement réalisable. Mais Google et AWS ont une vision plus large, poursuit-il. « Les Redshift, les Snowflake et Google s'attaquent à des déploiements de moindre envergure. C'est la plus grosse partie du marché. Il y a très peu d'entreprises qui ont des données de l’ordre du pétaoctet. »
A ces entreprises, l’analyste y ajoute une autre classe : celles qui veulent repartir de zéro pour alimenter des projets clé de transformation numérique. « De nombreuses entreprises sont attirées par ces plateformes cloud en raison des services d'analyse connexes de Google, tels que BigQuery ML », assure enfin Doug Henschen.