Le stockage de données se doit d’être de plus en plus efficient, tout en conservant les performances, surtout quand il s’agit de disques NVMe dernière génération.
Mais dans cette course à la performance green, vers quels systèmes se tourner et quels indicateurs regarder ?
Vous avez déjà du les croiser lors de vos choix de supports de stockage, notamment pour les SSD NVMe et vous en connaissez sûrement déjà quelques-uns, mais procédons tout de même à un rappel des indicateurs, bien souvent représentés par des sigles, liés au monde du stockage de données :
– Les IOPS (Inputs/Outputs Per Second) : Le nombre d’opérations d’entrées et de sorties par secondes (en écriture et en lecture) exprimé en millions ;
– Le DWPD (Drive Writes Per Day) : Le nombre moyen d’écritures complètes du disque par jour, variant généralement entre 1 et 3, même si certains sont à 0.2 (Samsung BM1743, ou pour les SSD les moins endurants) et jusqu’à 100 pour les plus endurants (DapuStor X2900P). Un SSD de 4TB avec un DWPD de 3 correspond à un disque sur lequel on peut écrire 3 fois 4TB par jour (12TB en tout pour ceux qui suivent) ;
– Le MTBF (Mean Time Between Failures) : Ce signe correspond au délai moyen entre les défaillances d’un disque, exprimé en millions d’heures (généralement entre 2M et 2.5M avant l’apparition d’une panne) ;
– L’AFR (Annual Failure Rate) : Le taux moyen de SSD défaillants, exprimé en pourcents, oscillant généralement entre 0.2% et 2% (sur une batch de 500 000 disques, un AFR peut être de 0.4%, soit 2000 disques qui seront défaillants par an en moyenne);
– Le TBW (TeraBytes Writting) : Une mesure de l’endurance d’un disque, correspondant à la quantité totale de données pouvant être écrite sur un disque en conservant les mêmes performances ;
– L’UBER (Unrecoverable Bit Error Ratio) : Un indicateur du ratio des erreurs des bits du disque, exprimé en nombre de secteurs potentiellement sujets à de la corruption par tranche de 10^17 bits. Le calcul de cet indicateur est relatif au nombre d’erreurs divisé par le nombre de bits lus à un instant i.
Et la liste pourrait encore continuer, mais afin de vous éviter un mal de crâne, gardons les choses simples, surtout qu’un nouvel indicateur, prenant en compte la consommation des supports de stockage ainsi que leurs performances, fait son entrée et pourrait bientôt se retrouver dans les spécifications de vos SSD et autres systèmes de stockage, baies SAN ou Flash.
Sans l’attendre plus longtemps, voici le TOPHBW ! Le quoi ? …….
Le “Trans Optimal Point Hot-Band Workload” est un indicateur mesurant le nombre moyen d’IOPS par watts d’un système multi-disques au point optimal d’une charge de travail spécifique (« Hot Band ») nécessitant l’accès fréquent et intensif à un jeu de données précis.
Si vous n’avez pas compris, retenez tout simplement que cette métrique, exprimée en IOPS par Watt (IOPS/W) sert surtout à classer les systèmes les plus efficients (consommant le moins d’énergie) lors de charges de travail intenses. Ces charges de travail intenses ne correspondent pas à du calcul sur GPU pour l’inférence de LLM non, car nous parlons ici de systèmes de stockage, mais bien aux mouvements massifs de données entre ces baies de stockage et les systèmes équipés de processeurs, ram, …
Quand on sait que la résilience est la mesure la plus carbonée (elle représente près de 36% du total des émissions liées à la cybersécurité, notamment avec la redondance des sauvegardes On-Premise/Cloud), cet indicateur, bien que peu connu, pourrait devenir une référence d’ici peu. A surveiller donc !
C’est la société Américaine SNIA Emerald™ qui est accréditée par l’EPA (l’Agence de Protection de l’Environnement des US) afin d’agréger les données du programme ENERGY STAR et d’en sortir des rapports indiquant quels sont les constructeurs d’équipements de stockage pour Data Center et Entreprises répondant aux plus hauts niveaux d’efficience.
Vous avez forcément déjà vu la pastille ENERGY STAR sur vos écrans, moniteurs ou sur certains de vos équipements, elle indique que le produit a passé des tests d’efficacité énergétique et environnementale, et qu’il est donc plus efficient que d’autres contreparties.
Dans le secteur des baies et serveurs de stockages, trois niveaux d’efficience sont possibles : Online-2, Online-3 et Online-4 (description ici), le plus haut niveau étant le plus désirable et celui que les constructeurs essaient d’obtenir.
Ces niveaux sont divisés en deux catégories, selon que les disques utilisés soient des SSD SATA/SAS (catégorie Disk Set Online) ou des SSD NVMe (catégorie NVSS Disk Set Online).
Afin de comparer les équipements des constructeurs répondants au niveau Online-4, il est possible de réaliser un test mesurant le TOPHBW de chacun, avec une charge de travail identique évidemment. Et ce test se nomme le TOPHBWT (le T à la fin du sigle veut dire Test).
Peu d’entreprises peuvent se vanter d’avoir le niveau NVSS Disk Set Online-4, et parmi elles, on retrouve HP Entreprise, DELL, IBM, Hitachi Vantara et Pure Storage. Deux entreprises manquent à l’appel, NetApp et Huawei qui n’ont visiblement pas effectué les audits nécessaires à l’obtention du niveau 4, bien que NetApp soit présent dans la liste des constructeurs ayant obtenu les niveaux Disk Set Online-2 et Disk Set Online-3 pour ses baies de stockage.
Huawei, avec des baies OceanStor pourtant très efficientes, remplies de 36 SSD Palm-Size propriétaires, n’aurait sans doute pas de mal à se hisser dans les premières positions de ce classement.
On pourrait également penser que des entreprises comme DDN (DataDirect Networks, avec des baies Flash utilisant le File System Lustre), Seagate (avec leurs baies Corvault) ou encore Western Digital (avec les baies OpenFlex Data24 4000 NVMe over Fabric) puissent obtenir la certification niveau-4, mais reste encore à faire les tests (peut être couverts dans un prochain article).
Selon ce graphique, c’est Hitachi Vantara qui se loge en première place du classement comparant les baies des constructeurs certifiés niveau 4 (prise de précaution ici car ce sont les commanditaires de ce comparatif..).
Leurs baies VSP One Block 28 et 26 se placent en première et seconde position, avec plus de 530 IOPS/W et 430 IOPS/W respectivement. Vous pouvez consulter la documentation technique de ces baies à cette adresse.
L’efficience de celles-ci, par rapport à d’autres servant, in fine, la même fonction, peut s’expliquer par la qualité des composants et les références des disques utilisés. Le test ne dit pas si les SSD NVMe, très probablement aux formats U.2, sont les mêmes entre les plateformes, car, en fonction de ceux-ci, il est très facile d’augmenter ou de diminuer la consommation totale du système.
Enfin, vous noterez que les baies de stockage Pure Storage, bien qu’optimisées pour le stockage Full-Flash haute densité, ne sont qu’en 14, 15 et 16èmes positions, pour un maximum de 55 IOPS/W. Ces baies utilisent des modules de stockages appelés DFM (DirectFlash Modules) et non des SSD U.2/U.3 conventionnels, qui n’ont pas de contrôleurs, mais qui utilisent les CPU du système à cet effet. Ces processeurs doivent être très performants, ce qui peut expliquer la baisse d’efficience, bien que les IOPS des DFM de Pure Storage doit être supérieure à un SSD NVMe PCIe Gen 4 moyen-haut de gamme.
Les baies de stockage les plus efficientes sont donc celles d’Hitachi Vantara et leur suite logiciel intégrée Lumada™ prend également en compte l’édition de rapports estimant l’empreinte carbone totale des baies présentes et opérationnelles au sein d’une infrastructure de stockage, afin d’avoir une représentation tangible de votre consommation énergétique, ce qui ne saurait qu’être fortement utile pour l’obtention de certifications CGDC™ (Certified Green Data Center, niveaux Professionnal, Specialist ou Expert).
Suivez cette nouvelle métrique de près (le TOPHBW, vous aviez déjà oublié ?) car il est probable qu’elle apparaissent au frontispice des solutions de stockages “green” dans les prochains mois.
Même si le test présenté ci-dessus ne compare que des baies SAN avec disques Flash, il serait tout à fait concevable de créer un indicateur sensiblement équivalent pour de solutions de stockage sur bandes, plus efficientes car déconnectées 99% du temps, mais moins efficaces en termes de performances et d’IOPS (les vitesses ne dépassant pas celles de disques-durs SAS).
Ces solutions de stockage et d’archivage, qui assurent le pérennité et la sécurité des actifs conservés, restent tout de même l’option principale pour du stockage de masse “green”.
Pour en apprendre davantage sur les notions présentées dans cet article (en Anglais) : Blocks And Files, Hitachi Vantara.
—
Chez SIENNA, on s’occupe de la protection contre les ransomwares et de la préservation de vos actifs les plus sensibles avec des solutions de stockage sur bandes magnétiques, mais on utilise aussi des SSD pour nos transferts déconnectés (Air-Gap) ultra sécurisés !
Suivez-nous sur LinkedIn et allez lire notre dernier article, vous présentant 25 SSD NVMe différents et notre classement, qui saura certainement répondre à vos besoins !