La croissance incessante du stockage entraîne la sortie des clusters élastiques Amazon DocumentDB •

Fonctionnalité sponsorisée Récemment, Amazon Web Services (AWS) a annoncé la dernière fonctionnalité d’Amazon DocumentDB (avec compatibilité MongoDB) qui permet aux organisations d’utiliser Amazon DocumentDB pour les charges de travail de documents de pratiquement n’importe quelle échelle et taille. Les clusters élastiques permettent une mise à l’échelle élastique des bases de données de documents pour gérer des millions de lectures et d’écritures par seconde avec des pétaoctets de capacité de stockage.
Au cours des dernières années, les bases de données documentaires natives JavaScript Object Notation (JSON) ont offert une alternative attrayante aux produits relationnels traditionnels avec plus de flexibilité que les schémas relationnels rigides. Les infrastructures entièrement gérées basées sur le cloud ont rendu ces bases de données de nouvelle génération encore plus attrayantes pour les entreprises ayant des besoins en données volumineux en éliminant une grande partie des frais généraux administratifs.
De nombreuses applications repoussent désormais les limites de ces bases de données. La croissance rapide entraîne le besoin d’encore plus de débit de données et de capacité de stockage. Bien que certaines bases de données de documents JSON natives existantes puissent répondre à ces besoins de mise à l’échelle aujourd’hui, elles sont souvent lentes à évoluer, ont un impact sur les performances lors des opérations de mise à l’échelle et peuvent être coûteuses. Il est donc difficile pour les entreprises d’équilibrer la facilité de gestion, l’échelle et le coût.
C’est cette croissance incessante qui a incité AWS à lancer une nouvelle fonctionnalité Amazon DocumentDB qui promet une capacité de stockage plus élevée et une concentration sur la prise en charge d’applications à grande échelle.
L’histoire d’Amazon DocumentDB
AWS a lancé Amazon DocumentDB en tant que service de base de données géré en janvier 2019 dans le but d’apporter plus de flexibilité à ses clients basés sur le cloud. Il s’agit d’une base de données basée sur des documents, structurée autour de documents JSON au lieu des structures basées sur des tables que l’on trouve dans les bases de données relationnelles traditionnelles.
Le format JSON, populaire dans les implémentations de bases de données NoSQL, est utile pour les développeurs d’applications qui ont tendance à penser en termes d’API cloud plutôt qu’en termes de requêtes SQL. Comme le format de stockage et le mécanisme de requête pour JSON simplifient le processus de requête, les développeurs n’ont pas besoin d’un outil de mappage relationnel d’objet pour traduire entre un schéma relationnel et leur application.
JSON est un format de stockage utile pour les applications susceptibles de modifier régulièrement leurs structures de données. En tant que format de document unique, il n’utilise pas les mêmes schémas rigides que l’on trouve dans les systèmes relationnels. Changer un schéma relationnel est un gros problème, impliquant une migration de schéma soigneusement planifiée qui pourrait avoir un impact sur la production. Les organisations peuvent certainement le faire, mais cela ne doit pas être fait à la légère. Non seulement Amazon DocumentDB offre une flexibilité de schéma pour le développement d’applications, mais son architecture cloud native offre également une flexibilité pour faire évoluer les opérations. L’ajout d’un nouveau champ à un enregistrement JSON consiste simplement à ajouter une autre paire nom-valeur à l’enregistrement qui en a besoin.
« C’est formidable pour la flexibilité », explique Vin Yu, chef de produit technique senior chez AWS. « Non seulement Amazon DocumentDB offre une flexibilité de schéma pour le développement d’applications, mais son architecture cloud native offre également une flexibilité pour faire évoluer les opérations. Les niveaux de stockage et de calcul découplés permettent de faire évoluer le stockage de la base de données de documents à partir de la capacité du processeur », explique-t-il. Avec cette architecture cloud native, le stockage évolue automatiquement jusqu’à 64 Tio (tebibyte) sans aucun impact sur les applications. « La limite de stockage de 64 Tio est suffisamment élevée pour répondre aux besoins de nombreuses applications », déclare Yu.
“L’évolutivité peut être un défi pour les applications qui repoussent les limites en termes de stockage et de débit. Il peut s’agir d’applications financières mobiles populaires utilisées par des millions de personnes”, explique Yu. Une autre application courante est le jeu. “Imaginez le nombre de personnes qui utilisent aujourd’hui plusieurs appareils pour se divertir”, dit-il. “Lorsqu’ils stockent un nouvel enregistrement pour un jeu vidéo ou accèdent à un profil d’utilisateur, tous ces enregistrements et documents doivent être stockés et accessibles à des millions d’utilisateurs à tout moment.” Une entreprise doit avoir confiance dans sa capacité de stockage et de récupération de base de données à grande échelle.
Les clients pourraient contourner ces problèmes en utilisant des instances virtuelles plus puissantes pour exécuter Amazon DocumentDB, mais ils finiront également par atteindre un plafond. L’étape suivante consiste à créer plusieurs instances Amazon DocumentDB pour gérer davantage de données. Cela leur donnerait plusieurs écritures et les amènerait au-dessus du plafond de stockage de 64 Tib par instance. L’inconvénient est qu’ils devraient gérer eux-mêmes ces instances, déterminer où stocker leurs données sur un service multi-instance et se souvenir où les récupérer.
Fonctionnement des clusters élastiques Amazon DocumentDB
C’est pour cette raison qu’Amazon a voulu rendre Amazon DocumentDB encore plus évolutif pour les clients et a construit une solution entièrement gérée et facile à mettre à l’échelle. Avancez vers les clusters élastiques Amazon DocumentDB.
Amazon DocumentDB Elastic Clusters utilise le partitionnement pour diviser les données entre les instances de calcul sous-jacentes appelées partitions. Amazon DocumentDB permet aux clients d’utiliser les API de partitionnement MongoDB pour créer des collections partitionnées qui permettent aux données d’être distribuées sur les partitions, chacune avec son propre écrivain, augmentant ainsi leur débit. “Le service passe de dizaines de milliers d’écritures par seconde vues sous l’Amazon DocumentDB d’origine à plus d’un million”, explique Yu.
“La clé de partition indique au système comment distribuer les données. Cela peut aller d’une chaîne d’ID utilisateur à un horodatage. Amazon peut travailler avec les clients pour sélectionner la clé de partition la plus appropriée afin d’assurer une distribution uniforme des partitions sur plusieurs clusters”, explique Yu. .
« Avec Elastic Clusters, la mise à l’échelle du calcul est simple et les clients peuvent facilement faire évoluer les charges de travail sur Amazon DocumentDB en quelques minutes avec peu ou pas de temps d’arrêt ou d’impact sur les performances », déclare Yu. “Elastic Clusters offre également des capacités de gestion différenciées telles que des sauvegardes sans impact et une restauration rapide à un moment donné, permettant aux clients de se concentrer davantage sur leurs applications plutôt que sur la gestion de leur base de données.”
AWS a donné la priorité à la simplification de la gestion des partitions. “AWS a ses propres avions de contrôle pour gérer tout cela”, explique Yu. “Les organisations n’ont pas à se soucier de l’aspect réseau du sharding à l’intérieur de leur cluster, de l’équilibrage de charge, des correctifs ou de l’ajout et de la suppression de shards.”
Évolutivité à la demande
Cette gestion en arrière-plan apporte plus que des capacités d’évolutivité accrues aux clusters élastiques Amazon DocumentDB. Cela permet également de faciliter la mise à l’échelle du système lorsque les exigences de charge de travail diminuent. “La mise à l’échelle des fragments de cette manière est aussi simple que de changer un seul nombre dans le tableau de bord”, explique Yu. “Cela aide les clients à gérer les coûts s’ils constatent que leurs transactions moyennes par seconde chutent pendant certaines périodes. Étant donné que le service dissocie la capacité de stockage et de calcul, ils peuvent réduire leurs capacités informatiques sans réduire leur stockage de documents.”
AWS a maintenu la haute disponibilité d’Amazon DocumentDB dans les clusters élastiques. « Le service copie six fois chaque écriture dans la base de données, quel que soit le nombre de répliques en cours d’exécution, et le client ne paie que pour une copie. Cela rend les données très durables », explique Yu. “Elastic Clusters propose également par défaut trois nœuds de réplique par cluster de partition s’exécutant sur plusieurs zones de disponibilité (AZ).”
“Ces répliques ne sont pas là uniquement à des fins de haute disponibilité”, déclare Yu. “Ils sont utilisés comme réplicas en lecture de production réguliers, améliorant les performances des bases de données à lecture intensive. Les clients peuvent configurer le nombre de nœuds de réplica en lecture par cluster de fragments, en l’ajustant à la hausse ou à la baisse en fonction de la criticité de leur base de données. Par exemple, un développement ou la base de données d’analyse n’a peut-être pas besoin d’autant de répliques », dit-il.
Modèle de tarification et de consommation d’Amazon DocumentDB Elastic Clusters
« Semblable à Amazon DocumentDB, Elastic Clusters a un modèle de tarification à l’utilisation. Les clients apprécient la prévisibilité de la facturation basée sur la consommation », déclare Yu. “Elastic Clusters est basé sur des fragments plutôt que sur des instances individuelles. Les clients ont la possibilité de configurer le nombre de vCPU, qui est une unité prévisible pour laquelle ils paient.” Les clients peuvent commencer à utiliser Elastic Clusters avec une configuration à un seul fragment et à faible vCPU, puis évoluer en ajoutant plus de fragments ou en augmentant les vCPU selon les besoins.
L’Amazon DocumentDB d’origine peut également être utilisé, ce qui sera réconfortant pour ceux qui préfèrent configurer et payer leur service de base de données de documents par instance. Néanmoins, Yu voit les clients adopter progressivement les clusters élastiques comme option de base de données de documents gérés par défaut au fil du temps. « Avec Elastic Clusters, les clients peuvent répondre de manière rentable aux besoins de leurs charges de travail documentaires les plus exigeantes », déclare-t-il.
Amazon continuera d’ajouter des fonctionnalités aux clusters élastiques, en partant des besoins des clients. « Nous sommes ravis de continuer à innover pour nos clients », ajoute Yu. “Nous nous efforçons de fournir à nos clients les capacités dont ils ont besoin pour s’adapter à l’avenir.”
Amazon DocumentDB Elastic Clusters représente plus qu’une simple nouvelle fonctionnalité. Cela souligne également les exigences croissantes en matière de taille des applications modernes basées sur le cloud. Alors que les volumes de stockage et de traitement des données continuent d’augmenter, les techniques d’évolutivité accrue deviendront plus essentielles pour prendre en charge les applications les plus exigeantes d’aujourd’hui et donner aux clients les capacités nécessaires à leur croissance future.
Sponsorisé par AWS.