Amazon ouvre enfin les portes de son analytique sans serveur

  • FrançaisFrançais



  • Si vous souhaitez exécuter des analyses dans un environnement cloud sans serveur, Amazon Web Services estime qu’il peut vous aider tout en réduisant vos coûts d’exploitation et en simplifiant les déploiements.

    Comme d’habitude pour Amazon, le géant du cloud a présenté en avant-première cette plate-forme EMR Serverless – EMR signifiant autrefois Elastic MapReduce – lors de sa conférence Re:Invent en décembre, et n’a ouvert les services au public que cette semaine.

    AWS n’est pas étranger au sans serveur avec des produits comme Lambda. Cependant, son offre EMR cible spécifiquement les charges de travail d’analyse, telles que celles utilisant Apache Spark, Hive et Presto.

    La plate-forme EMR existante d’Amazon prenait déjà en charge les déploiements sur les clusters VPC exécutés dans EC2, les clusters Kubernetes dans EKS et les déploiements sur site exécutés sur Outposts. Et bien que cela offre un meilleur contrôle sur l’application et les ressources de calcul, il a également fallu que l’utilisateur configure et gère manuellement le cluster.

    De plus, les ressources de calcul et de mémoire nécessaires à de nombreuses charges de travail d’analyse de données sont susceptibles de changer en fonction de la complexité et du volume des données traitées, selon Amazon.

    EMS Serverless promet d’éliminer cette complexité en provisionnant et en adaptant automatiquement les ressources de calcul pour répondre aux exigences des charges de travail open source. Comme plus ou moins de ressources sont nécessaires pour s’adapter à l’évolution des volumes de données, la plate-forme ajoute ou supprime automatiquement des travailleurs. Cela, selon Amazon, garantit que les ressources de calcul ne sont pas sous-utilisées ou sur-engagées. Et les clients ne sont facturés que pour le temps et le nombre de travailleurs nécessaires pour terminer le travail.

    Les clients peuvent contrôler davantage les coûts en spécifiant un nombre minimum et maximum de travailleurs et les processeurs virtuels et la mémoire alloués à chaque travailleur. Chaque application est entièrement isolée et s’exécute dans une instance sécurisée.

    Selon Amazon, ces capacités rendent la plate-forme idéale pour un certain nombre de pipelines de données, de clusters partagés et de charges de travail de données interactives.

    Par défaut, les charges de travail EMS Serverless sont configurées pour démarrer lorsque les travaux sont soumis et s’arrêter après que l’application a été inactive pendant plus de 15 minutes. Cependant, les clients peuvent également initialiser les travailleurs pour réduire le temps nécessaire au démarrage du processus.

    EMR Serverless prend également en charge les applications partagées à l’aide des rôles de gestion des identités et des accès d’Amazon. Cela permet à plusieurs locataires de soumettre des travaux en utilisant un pool commun de travailleurs, a expliqué la société dans un communiqué.

    Au lancement, EMS Serverless prend en charge les applications créées à l’aide des frameworks Apache Spark et Hive.

    Quelle que soit la manière dont l’application est déployée, les charges de travail sont gérées de manière centralisée depuis EMR Studio d’Amazon. Le plan de contrôle permet également aux clients de créer de nouvelles charges de travail, de soumettre des travaux et de consulter les données de diagnostic. Le service s’intègre également au stockage d’objets AWS S3, permettant aux journaux Spark et Hive d’être enregistrés pour examen.

    EMR Serverless est désormais disponible dans les régions d’Amazon en Virginie du Nord, en Oregon, en Irlande et à Tokyo. ®

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.