Business Team Meeting Discussion Working Concept

Cloud Object Storage d’IBM: web-scale avec un mode de déploiement sur site ou hybride

Digitalisation IBM Cloud Object Storage est une solution de stockage-objet développée par Cleversafe, société fondée en 2004 et rachetée par IBM en novembre 2015. L’année suivante, IBM a été classé par le cabinet Gartner à la première place dans le domaine des « Distributed File Systems and Object Storage » grâce notamment à Cloud Object Storage mais aussi à Spectrum Scale.  

SMA

SMA

Une infrastructure sans limites

 

IBM Cloud Object Storage exprime tout son potentiel lorsque la volumétrie des données à traiter est massive.  De nombreux clients de cette solution ont plus de 100 péta-octets déployés en production et certains approchent même l’exa-octet. C’est bien au-delà de ce qui est viable avec un stockage de type NAS.

Avec ces grandes volumétries et avec l’exigence d’étendre constamment la capacité et la bande passante, certains usages propres aux systèmes traditionnels ont dû être reconsidérés.  C’est le cas pour la redondance des données ; le RAID traditionnel n’est pas la manière la plus économe pour se prémunir contre une panne disque. Une méthode basée sur l’Erasure Coding propose une efficacité supérieure, tout en protégeant également contre la perte d’un site entier.

De plus, l’architecture des systèmes web-scale comme IBM Cloud Object Storage vous exonère de faire des remplacements du système complet « drop and replace ».  La croissance organique et le renouvellement du matériel se fait par l’ajout de briques (ou nodes) au système. L’intégration et le décommissionnement des nodes se doit d’être une démarche aisée avec un rééquilibrage automatique des données, car ces opérations sont effectuées régulièrement en assurant la continuité du service sans interruption.

En résumé, avec IBM Cloud Object Storage, l’accès à la donnée se fait sans interruption au cours des mises à jour logicielles, des actualisations de matériel, face aux défaillances de sites, de nœuds ou de disques.

Le découpage en tranches

La redondance des données est primordiale pour assurer leur intégrité, même après une ou plusieurs pannes de divers types. On remarque que la plupart des clients renonce à sauvegarder un système Object Store car il est trop volumineux et on ne dispose pas d’assez d’heures dans la journée. Un degré de durabilité important est donc primordial.

L’algorithme de type Erasure Coding propre à IBM Cloud Object Storage s’appelle Information Dispersal. Protégée par plusieurs brevets, cette technique remplace le RAID, la réplication et même le chiffrement des données. Configurable en fonction du nombre de sites et des besoins de tolérance de panne énoncés dans le SLA, les données et leurs parités sont dispersées de manière optimale sur l’ensemble des nodes du cluster.

Aspect unique de cette solution, aucun disque, nœud ou site ne contient suffisamment d’informations pour permettre de récupérer des données. Donc, un site compromis ne peut provoquer de violation de la confidentialité des données. Le chiffrement d’IBM Cloud Object Storage, appelé « SecureSlice ZeroTouch », est intégré au cœur même du système avec une gestion des clés embarquée. Le chiffrement fournit une sécurité de haut niveau, pour les données sur les disques comme pour les données en mouvement.

Un déploiement flexible

IBM Cloud Object Storage propose un vaste choix de modèles de déploiement, on-premise (sous forme logicielle ou d’appliance), en cloud hybride et off-premise (cloud) avec un rapport coût/performances inégalé. Il offre également la portabilité de la licence et des outils et des fonctionnalités homogènes on-cloud et on-premise.

Indépendamment du mode de déploiement, IBM Cloud Object Storage propose une large gamme de connectivité réseau, des API pour S3, Swift et le support de NFS pour l’accès aux objets.

 

Cloud Computing Modern Communication Technology on Blackboard

Pour quels besoins dans l’entreprise ?

Le stockage-objet ne vise pas les bases de données qui nécessitent une haute performance d’entrée/sortie ni les environnements de calcul haute performance où chaque bloc de donnée est modifié fréquemment.

Son utilisation est clairement orientée soit vers l’accès concurrent en lecture de milliers d’utilisateurs à des millions de fichiers de toutes tailles, soit vers des accès séquentiels massifs, de fichiers vidéo, de containers de sauvegarde, etc…

Les archives actives

Le positionnement historique du stockage-objet est la gestion des archives actives. A l’origine, il s’agit de données dont les besoins de rétention et de préservation s’étalent sur des durées longues, imposées souvent par des impératifs légaux (courriels, fichiers, dossiers individuels, …). Dans ce cadre, les besoins d’accès aux fichiers, une fois archivés, sont relativement faibles, et l’activité de l’archive négligeable.

Peu à peu, l’intérêt du stockage-objet s’est étendu à de nouveaux besoins de la société : la recherche géologique, la conquête spatiale, la gestion des dossiers patients, le séquençage du génome, les fichiers audio et vidéo générés par les médias, la vidéosurveillance des entreprises, des villes et des transports. Avec l’augmentation des capacités de traitement, celles qui n’étaient que des archives de conservation sont devenus des archives actives, consultées et traitées régulièrement.

Connaissez-vous Spectrum Scale ? C’est une couche logicielle issue des laboratoires IBM qui fournit des services de stockage fichiers. Conçue pour les accès haut débit et hautement parallélisés, Spectrum Scale permet une bonne maitrise de la gestion des données non-structurées. Il est possible de créer des règles de hiérarchisation des données spécifiques à chaque type de données créées, aux personnes autorisées à accéder à chaque niveau de stockage et la manière dont les données sont migrées vers les niveaux de stockage inférieurs. IBM Cloud Object Storage est une excellente alternative pour ce niveau de stockage inférieur.

Partage de fichiers d’entreprise

Le manque de souplesse des partages de fichiers traditionnels (NAS) a rapidement poussé les utilisateurs à rechercher des solutions de stockage de fichiers (bureautiques ou autres) accessibles partout en mobilité et dont les permissions de partages peuvent être définies de manière simple.

Les portails collaboratifs de l’entreprise ou stockages en ligne (Dropbox, Box et autres Sharefile …), s’appuient ou peuvent s’appuyer directement sur un stockage-objet.

Données de sauvegarde

Les entreprises cherchent tout naturellement à abandonner les stockages coûteux pour leurs besoins de sauvegarde. S’il n’est pas toujours possible pour les  sauvegardes nécessitant des performances importantes (premier tiers), introduire un stockage-objet en second tiers améliore clairement le TCO de la solution de sauvegarde et bénéficie de ses propriétés de durabilité.

La plupart des produits de sauvegarde du marché (IBM Spectrum Protect, CommVault, Veritas…) peuvent nativement bénéficier des Object Store comme cible de stockage ; pour les autres, des passerelles sont disponibles.

 

wirdibm

 

 

 

Auteurs:

Barton Dozier, Senior Consultant / Storage Specialist, WIRD SA, Genève

Michel Bot, IT Architect, WIRD SA Genève