dimanche 15 juin 2014

Archivage avec HANA, de grands changements à venir

Durant des années, les limites techniques, nous ont dictés l'obligation de limiter les données dans les systèmes transactionnels. Afin de limiter ces données, les process traditionnels incluaient la mise en place de processus d'archivage, de transfert vers des systèmes d'archivage électronique (SAE) et le plus souvent des transferts vers des systèmes décisionnels, la manipulation des données dans les SAE étant généralement très limitée. 

La révolution "Big Data"
Sauf que le "Big Data" et HANA remettent en cause ce modèle traditionnel et ce pour deux raisons principales. D'abord, quand vous traitez du "Big Data", gérer quelques Terra-octets de données supplémentaires n'est pas un problème critique. Ensuite, HANA, à la différence des systèmes traditionnels, est un système transactionnel ET un système décisionnel. Or, dans un système décisionnel, plus vous avez de données, plus vos analyses seront précises. Des analyses précises mènent à de meilleures décisions. De meilleures décisions mènent à l'efficience opérationnelle, à des réductions de coûts et à des réductions de risques. Sur un système HANA, vous avez donc tout intérêt à conserver les informations de détail le plus longtemps possible. Bon, vous me direz pourquoi pas mais l'objectif de l'archivage était à la fois supprimer des données pour gagner en performance mais aussi transférer des données sur des systèmes moins cher pour diminuer le coût total de possession (TCO). Et à priori, ce n'est pas avec HANA que le TCO va se réduire.

Tout est dans la gestion de la température !
SAP est bien évidement conscient de cette objection et travaille a une solution : la température des données ! Le principe est simple. Adapter, le stockage des données en fonction de leur utilisation. Les données les plus utilisées ou données chaudes doivent se situer en mémoire. Les données utilisées ponctuellement ou données tièdes doivent se situer sur disque sur le serveur HANA. Enfin, les données rarement utilisées ou données froides devront être stockées sur SAP IQ ex Sybase IQ. Avec ce principe, plus besoin d'archivage, vous stockez vos données sur un serveur qui a une très grande capacité de stockage, de très bon temps de réponse aussi bien en chargement qu'en lecture et ce qui ne gâche rien il suffit d'un serveur standard pour héberger une solution SAP IQ. 
 
 Vitesse et Performance
Hasard vous me direz, SAP vient juste de battre deux records du monde avec une base SAP IQ. Le premier concerne le chargement et l'indexation de données à une vitesse de 33,4 terabytes par heure. Le second concerne la création d'une base de donnée de 12,1 petabytes. L'objectif de ces deux records me semble clair : nous prouver que SAP IQ a la capacité de stocker nos archives "Big Data" ou pas "Big Data". Cela sans compter que SAP IQ est une base en colonne et que donc la compression des données est très bonne et l'accès en lecture bien meilleur que sur les bases de données relationnelles traditionnelles.

L'archivage en ligne
SAP a donc les moyens de stocker les données. La question qui reste en suspens est donc comment stocker les données dans cette base. C'est ici qu'intervient la technologie "Near-line Storage" ou NLS. NLS est une technologie qui permet de stocker des informations issues de SAP BW dans différentes bases de données dont SAP IQ. L'avantage de NLS sur de l'archivage classique, c'est que, lors d'une requête, le serveur BW sera capable de rapatrier les données stockées via NLS. NLS est donc une technologie d'archivage transparente pour les utilisateurs qui peuvent accéder à leurs données via leur outils habituels, sans savoir que les données ont été archivées. 

Les seules "faiblesses" de cette technologies étaient: 
  • Les données stockées via cette technologie n'étaient pas modifiables.
  • Les données sont stockées via des règles implémentées par les administrateurs généralement en fonction de la durée de rétention des données. 
  • Cette technologie n'existe que pour BW.

"étaient" car au Sapphire, il y a eu plusieurs annonces autour de NLS.
  • SAP travaille à ce que les données stockées via NLS soient modifiables. L'objectif est d'éviter des rechargements dans BW à la fois pénible et long. Cette modification est annoncée pour cette année (2014).
  • SAP réfléchit à implémenter un moteur qui déterminera automatiquement quelles données devraient être déplacées vers NLS. 
  •  SAP travaille sur une nouvelle solution fonctionnant sous HANA appelée "Extended Storage". L'objectif est de pouvoir stocker des données dans SAP IQ sur le principe de la température des données.
Jusqu'à présent, je n'ai pas parlé du coût de la solution NLS. Ce qu'il faut savoir, c'est que si cette solution est payante, elle est souvent inclue dans des packages. D'autres part, certaines solutions basées sur NLS mais utilisant des bases de données concurrentes telle que DB2 peuvent être gratuite. Vous disposez donc d'un certain nombre d'argument pour bien négocier avec SAP.

En conclusion, j'ai le sentiment que même si l'archivage ne va pas disparaître, il va fortement évoluer. Vos données, même archivées, seront accessibles. Même si cet article concernait plus l'archivage des données que l'archivage légal, ce dernier sera forcément impacté par ces évolutions. En effet, comme l'administration fiscale a toujours toléré les audits sur les systèmes "live", cela pose des questions sur l'avenir des systèmes SAE ou autres "Content Serveur" pour stocker les archives de données. Enfin, comme on l'a bien vu, ces évolutions sont fortement liées à HANA. Il est donc fortement probable que SAP offre ces technologies avec HANA afin d'améliorer le retour sur investissement (ROI) de sa base de données "In-Memory". Cette option sonnerait le glas de diverses solution NLS ou de serveur de stockage de partenaires SAP.

Aucun commentaire:

Enregistrer un commentaire