Combler le fossé de l’observabilité

  • Français


  • Sponsorisé Dans l’informatique moderne, la visibilité est primordiale. Les administrateurs informatiques et les ingénieurs en fiabilité du site (SRE) survivent grâce à leur capacité à voir ce qui se passe dans leurs systèmes. Malheureusement, à mesure que les systèmes deviennent plus sophistiqués, il est devenu plus difficile de voir ce qu’ils font. C’est pourquoi l’industrie promeut l’observabilité en tant qu’évolution de concepts existants tels que la surveillance et les métriques. Les fournisseurs multiplient les outils pour combler un manque de visibilité croissant.

    Qu’est-ce que l’observabilité ?

    Les services informatiques surveillent l’infrastructure et les applications depuis des décennies, alors « Observabilité » n’est-il pas qu’un terme marketing pour ce qui est déjà une bonne pratique ? Pas selon Dhiraj Goklani, vice-président régional de l’informatique et du DevOps, APAC chez Splunk, qui a récemment lancé son Splunk Observability Cloud.

    « Nous avons eu une transition massive vers l’infrastructure cloud et les applications conteneurisées, car les organisations accélèrent considérablement leurs initiatives numériques et directes aux consommateurs », explique-t-il.

    Autrefois, les observateurs pouvaient facilement scruter les opérations informatiques en exécutant des programmes qui surveillaient directement les opérations de leurs serveurs. Les applications étaient monolithiques, vous pointiez donc un logiciel de surveillance vers elles et consignez les résultats. Les choses sont devenues beaucoup plus difficiles lorsque les entreprises ont commencé à tout faire abstraction et à le rendre plus distribué. Lorsqu’ils ont commencé à tout exécuter dans le cloud, ils se sont appuyés sur les services de surveillance des fournisseurs de services cloud. Lorsqu’ils répartissaient les opérations entre plusieurs sociétés cloud, ainsi que leurs propres solutions sur site, les choses devenaient plus décousues.

    Les applications composables ont rendu les choses encore plus difficiles. Pendant des années, les entreprises ont eu du mal à atomiser leurs applications, en les construisant à partir de pièces plus petites et plus faciles à gérer. Les microservices et les conteneurs qui les exécutent ont finalement acheté cette pratique au grand public, offrant aux équipes de développement des applications modulaires avec des éléments qu’elles pouvaient mettre à jour individuellement. L’inconvénient de cette approche était que ces éléments plus petits, fonctionnant sur une infrastructure cloud plus abstraite, devenaient plus difficiles à surveiller.

    Les développeurs accédaient désormais à ces services via des API lorsqu’ils les assemblaient pour créer de nouvelles applications. Ces interfaces devaient également être surveillées dans le cadre du parcours global de bout en bout. Les outils de surveillance existants sont souvent cloisonnés, conçus pour examiner certaines parties des domaines de la pile ou de l’infrastructure. Ils ne peuvent pas gérer des flux de travail complexes et décousus. C’est le vide que les outils d’observabilité comblent en associant les applications et l’infrastructure en une seule vue de bout en bout à tous les niveaux de la pile.

    Prendre note des traces

    Cette vue commune exige une meilleure télémétrie, explique Goklani. Splunk a fait ses armes en développant des outils qui ont fait passer l’analyse des journaux générés par la machine au niveau supérieur, permettant aux administrateurs informatiques et aux SRE de tirer un sens des rames de données opérationnelles. L’observabilité les combine avec les métriques qui résument les performances et la disponibilité. Ces formes de données opérationnelles sont bien comprises, mais il existe un troisième type qui est essentiel dans les infrastructures cloud composables modernes, explique Goklani : les traces.

    Les traces documentent les interactions entre les milliers, voire les millions, de microservices qui fonctionnent ensemble pour répondre à une demande d’application. Ces petits morceaux de code sont généralement dupliqués pour un mélange de fonctionnalité évolutive et de résilience.

    Lorsqu’un utilisateur d’une application basée sur des microservices se connecte à une application Web, modifie la configuration de son compte, parle à un technicien d’assistance dans une fenêtre de discussion, recherche des produits et compare les fonctionnalités, il touche des milliers de logiciels individuels. Vérifier leur panier puis payer avec un paiement touche plus. C’est plus difficile à suivre dans une infrastructure de microservices atomisée où de nombreux morceaux de code individuels fonctionnent ensemble, souvent sur une infrastructure appartenant à différentes entités.

    “J’appelle des traces des empreintes de pas dans les sables du temps”, ironise Goklani. “Ils retracent mon parcours à travers tous ces microservices en arrière-plan. Si ma transaction échoue, n’importe qui dans l’équipe des services mondiaux peut comprendre pourquoi cela s’est produit, pour moi en particulier. Je pourrais avoir une connexion lente ici dans mon réseau, ou cela pourrait être quelque chose à l’arrière qui l’a causé. “

    OpenTelemetry

    Le Cloud Observability Radar de GigaOm, qui analyse 14 concurrents dans l’espace d’observabilité, met en évidence le projet OpenTelemetry comme une initiative clé dans cet espace. Ce projet, auquel Splunk est un contributeur principal, est un framework d’observabilité open source géré par la Cloud Native Computing Foundation. Il a fusionné deux projets existants, OpenTracing et OpenCensus, qui offraient respectivement des API standard pour la collecte de traces et pour les métriques de comportement des applications.

    Le rapport GigaOm désigne également Splunk comme le seul surperformant dans le domaine de l’observabilité. « Splunk est devenu l’un des leaders dans le domaine de l’observabilité avec des acquisitions stratégiques et le développement de solutions organiques ciblées. »

    Splunk a débuté en 2003 avec une offre permettant de distiller de grandes quantités de données générées par machine à partir d’infrastructures technologiques. Depuis lors, elle a élargi son portefeuille de produits pour couvrir des aspects de l’informatique allant de la sécurité à l’IoT. De nos jours, il surveille un large éventail de données de performances d’infrastructure et d’applications tout en offrant aux administrateurs informatiques et aux SRE une plongée approfondie dans les journaux système pour les enquêtes médico-légales.

    GigaOm a classé Splunk au premier rang des autres fournisseurs en raison d’un large éventail d’intégrations et d’un riche ensemble de fonctions back-end. “Splunk ingère des données de fidélité totale de toutes les sources (journaux, métriques et traces) sur l’ensemble de la pile”, a déclaré le spécialiste de l’industrie. « Il offre également une évolutivité massive, des analyses sophistiquées en flux et une prise en charge native d’OpenTelemetry. »

    Nuage d’observabilité

    Splunk Observability Cloud rassemble plusieurs composants du portefeuille existant de l’entreprise sous une seule interface qui, selon lui, permet aux administrateurs informatiques et aux SRE de créer plus facilement ces vues de bout en bout. Celles-ci couvrent la surveillance des performances de l’infrastructure et des applications, ainsi que les observations des journaux. Il comprend également le produit Splunk Real User Monitoring, qui capture et mesure l’activité des utilisateurs à l’aide des interactions du navigateur avec les ressources back-end pour obtenir une image précise des expériences des utilisateurs dans le monde réel. Le produit complet inclut également Splunk On-Call, qui transmet tout problème émergent découvert aux membres appropriés de l’équipe de réponse aux incidents.

    Splunk Observability Cloud propose également un nouveau produit, Splunk Synthetic Monitoring, qui permet aux administrateurs informatiques et aux SRE de scripter les interactions pour tester les performances de différents types d’interaction. Cela complète ses autres outils avec la possibilité de surveiller les interactions courantes avec les applications critiques à des intervalles définis, en faisant rapidement apparaître tous les problèmes. Goklani met également en avant sa capacité à tester les interactions API.

    Splunk Observability Cloud est l’une des trois suites de ce type de Splunk. Ses frères et sœurs sont les produits IT et Security Cloud. Ils peuvent cibler différents cas d’utilisation, mais ils ont un point commun : un nouveau modèle de tarification. Splunk tarifait traditionnellement ses services en fonction de la quantité de données ingérées par les clients. L’approche basée sur la suite remplace cela par ce qu’elle appelle une tarification basée sur l’entité. Cela facture les produits en fonction de différents types d’unités d’infrastructure. Il peut s’agir d’une adresse IP ou d’un utilisateur individuel. La société définit ces unités en fonction des suites que le client utilise.

    Il est possible d’acheter tous les produits séparément et de profiter d’intégrations automatiques au fur et à mesure qu’ils se découvrent, explique Goklani, mais l’avantage de les unifier tous sous une seule interface est qu’ils facilitent le suivi et l’échange des workflows.

    « Dans le passé, les équipes informatiques et DevOps adoptaient une approche pivotante, passant d’un outil à l’autre, corrélant leurs informations et écrivant des solutions personnalisées », explique-t-il, que c’était le seul moyen d’obtenir une vue unifiée. “Maintenant, nous avons fourni une interface unifiée pour consommer toutes ces données.”

    Une interface unique aide les équipes DevOps et informatiques à maintenir la disponibilité des services, dit-il, protégeant les processus que les entreprises ne peuvent tout simplement pas laisser tomber. Il aide également les administrateurs informatiques et les SRE à maintenir les performances des services répartis sur différentes applications et infrastructures en faisant rapidement apparaître les problèmes et en permettant à différents membres de l’équipe de les analyser et de les résoudre à l’aide du même outil.

    Comment l’observabilité soutient DevOps

    De nos jours, les administrateurs informatiques et les SRE qui repèrent et gèrent ces problèmes sont tout aussi susceptibles d’être les personnes qui ont développé le code. Goklani explique que la collecte d’outils dans une suite d’observabilité prend en charge les disciplines DevOps qui placent les ingénieurs logiciels au centre du cycle de vie des services logiciels. Maintenant que les développeurs possèdent l’infrastructure cloud sous-jacente ainsi que le code lui-même, ils ont besoin d’un moyen d’obtenir une visibilité complète sur son fonctionnement et de le rendre fiable, performant et sécurisé. « L’observabilité aide à surveiller le cycle de vie DevOps », déclare Goklani.

    Une meilleure observabilité se traduit par des résultats concrets. Lenovo a commencé à utiliser Splunk Observability Cloud pour gérer son activité de commerce électronique. Elle a mis en œuvre l’outil pour recueillir des données à partir de ses systèmes de commerce électronique et identifier les problèmes émergents. Il a réduit le temps nécessaire pour récupérer d’une défaillance du système à cinq minutes au lieu d’une demi-heure.

    La suite s’est également avérée utile pour faire face à une augmentation inattendue de la demande en milieu de pandémie. Lenovo s’attendait à ce que son trafic augmente le Black Friday 2020 après avoir introduit des incitations tarifaires et des cadeaux de produits de jeu, mais il ne s’attendait pas à ce que le trafic augmente de 300 % de plus que l’année précédente. Splunk Observability Cloud a aidé l’entreprise à maintenir une disponibilité de 100 %, ont déclaré les dirigeants.

    Le changement de tarification de Splunk et le regroupement des produits dans un seul Splunk Observability Cloud vont de pair et représentent un changement radical pour une entreprise qui a construit ses revenus à l’octet. C’est l’offre de Splunk d’amener les clients à faire plus avec ses produits, en le poussant plus loin dans leurs environnements avec un portefeuille qu’il veut être omniprésent.

    Commandité par Splunk

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *