Quand la direction est devenue nucléaire sur un ingénieur logiciel innocent

  • Français


  • De garde Bien sûr, vous pouvez utiliser des mots comme “boum” et “exploser” lorsqu’il s’agit d’erreurs avec votre système. Mais un whoopsie pourrait-il avoir le potentiel de rendre une partie d’un pays inhabitable ? Bienvenue sur Appel.

    Notre histoire vient d’une lectrice renommée “Ellen” qui a passé le début des années 1980 à travailler dur dans le département informatique d’une société produisant des logiciels responsables (en partie) de la gestion des centrales nucléaires.

    Un tout nouveau système était en cours de déploiement, qui permettrait de savoir quelles stations étaient en ligne, quelle puissance elles pouvaient fournir, etc.

    La mise en service était en cours à l’aide d’un banc d’essai relié à un nouveau réacteur en construction. “Une équipe d’Américains se trouvait dans le bâtiment pour enseigner aux responsables de l’entreprise comment utiliser leur système”, a expliqué Ellen, “qui devait s’asseoir au-dessus du nôtre”.

    “Ils fournissaient l’équipement de contrôle du réacteur auquel notre système parlait.”

    Ça n’allait pas bien. Malgré quelques beaux équipements pour l’époque (pensez à un bureau en bois incurvé avec des PC DEC Rainbow intégrés dans la salle de contrôle et un tas de systèmes VAX/VMS dans un cluster à sécurité intégrée), il y avait des problèmes pour que le VAX parle à la centrale électrique . La ligne était en place, mais il n’y avait pas de communication.

    “Les cheveux étaient arrachés, les échelles de temps s’effondraient et j’avais des cheveux blancs à cause du stress”, a déclaré Ellen, “notamment parce que j’avais une prime de réussite.”

    Comme c’est si souvent le cas, un décor apparemment sans conséquence a été modifié et tout a pris vie. L’équivalent d’un ping a été envoyé et le réacteur a répondu : “Oui, je suis là.”

    “Strictement parlant, il s’agissait d’un simulateur de réacteur“, a ajouté Ellen, “un fait qui deviendra important plus tard.”

    Cependant, pour l’instant, les choses étaient en ligne, le logiciel fonctionnait et, même s’il ne restait que trois jours pour parcourir 10 jours de tests, l’équipe avait au moins une chance de se battre. Les tests ont été configurés pour s’exécuter séquentiellement pendant la nuit.

    Le PC Rainbow dans la salle de communication les exécutait et transmettait les résultats à l’imprimante. Ellen et co ont expliqué l’approche au responsable du site lors de la réunion de fin de journée, à laquelle les Américains ont également assisté. Autre point important.

    Pourtant, malgré l’approche de l’argent sans objet, bizarrement, il n’y avait pas de serrure sur la porte de la salle informatique. Alors que personne n’était censé toucher l’équipement, l’équipe d’Ellen n’a pris aucun risque et a collé une boîte en carton sur le PC avec les mots “Système en cours de test – NE PAS TOUCHER” griffonnés dessus.

    “Il était maintenant bien environ 22h30”, se souvient-elle, “alors l’équipe et moi sommes partis pour notre hôtel, dans le but de nous retrouver à la réunion du matin de 8h30.”

    Malheureusement, l’appel arriverait quelques bonnes heures avant cette réunion du matin. C’était avant l’époque du téléphone mobile omniprésent, Ellen avait un téléavertisseur qui sonnait d’urgence à 6 heures du matin. Elle devait se rendre sur le site MAINTENANT !

    A son arrivée, la tension dans l’atmosphère était palpable. Quelque chose s’était terriblement, terriblement mal passé. Le directeur du site était également présent, ainsi que le plus gros de tous les fromages – le directeur de la production d’électricité.

    “Une sorte de silence de mort s’est abattu sur la pièce”, se souvient-elle, “le genre juste avant qu’une pendaison publique ait lieu”.

    “Oui, j’étais nerveux.”

    “Il semblait que notre logiciel avait rencontré une sorte de problème et, par conséquent, le réacteur s’était déconnecté, les barres de contrôle avaient claqué, et ce n’était plus qu’une bouilloire surdimensionnée.”

    À ce stade, nous devons rappeler aux lecteurs qu’il s’agissait d’un simulateur, pas de la réalité.

    Si cela avait été un vrai réacteur, il aurait fallu des mois pour le récupérer, au prix de millions de livres.

    Et Ellen et son logiciel étaient clairement à blâmer.

    “Personne n’a pu me dire exactement ce qui s’était passé. Juste que c’était de ma faute”, a-t-elle déclaré.

    Cherchant à retarder son exécution, Ellen a demandé si elle pouvait revoir la sortie de l’imprimante ligne pour avoir une idée de ce qui aurait pu se passer. Les patrons ont accepté et lui ont accordé une heure de sursis alors qu’elle se dirigeait vers la salle de communication.

    En entrant dans la pièce (celle sans serrure), elle et l’équipe ont été accueillies par une scène de dévastation totale. La boîte avec le lettrage “Ne pas toucher” avait été jetée. Le PC de test était en bits et le disque manquait entièrement. L’imprimante ligne s’était arrêtée à mi-chemin lorsque le PC avait été attaqué.

    Alarmant, mais pas quelque chose qui provoquerait une crise du réacteur, juste un retard dans les tests.

    “J’ai demandé à un membre de mon équipe de reconnecter l’imprimante au VAX et de vider les journaux d’application pour moi”, se souvient Ellen. “On lui a dit de me les apporter même si j’étais en réunion – surtout si j’étais dans ce qui allait être une réunion stressante, c’est le moins qu’on puisse dire.”

    L’enquête s’est poursuivie et est devenue encore plus étrange. Les autres PC Rainbow étaient tous opérationnels. Ils n’auraient pas dû l’être – l’équipe d’Ellen devait encore les mettre en service, se contentant de les configurer à des fins d’acheminement des câbles. Et pourtant, ils étaient là, à fredonner.

    Ellen est revenue à la réunion avec ses découvertes. L’un des membres de l’équipe américaine était présent et a avoué avoir allumé les PC.

    “Quand on lui a demandé pourquoi”, a déclaré Ellen, “il a répondu que parce que nous, les Britanniques amateurs, avions tellement de retard sur le calendrier, il voulait commencer à former le personnel de la salle de contrôle, il voulait donc que tous les PC soient démarrés et prêts.”

    Alors… comment cela a-t-il été réalisé ? Le support pour démarrer les PC était enfermé dans le coffre-fort d’Ellen (“l’arrière de ma voiture”, a-t-elle avoué).

    Aucun problème. Le technicien américain avait simplement saisi le disque du PC exécutant les tests et l’avait copié sur les autres ordinateurs. “De toute évidence, cela a fonctionné car ils sont tous opérationnels”, a-t-il déclaré.

    Soudain, tout est devenu clair. Si Ellen avait une moustache à la Poirot, de sérieuses virevoltes auraient été nécessaires.

    Les bûches sont arrivées et ont été remises. Ellen a fait semblant de les étudier, mais savait déjà ce que les preuves allaient montrer.

    Ellen : “Donc, vous avez cloné le disque sur tous les PC…”

    Ingénieur US (fièrement) : “Oui, et gagné plusieurs jours”.

    Ellen (regardant le journal): “Et vous êtes allé sur un PC et avez demandé l’état du réacteur à la centrale électrique.”

    Ingénieur américain : “Oui, mais cela n’a pas fonctionné – votre logiciel est tellement plein de bugs, c’est de la merde totale.”

    Ellen : “Et quand vous avez cloné les disques, vous avez changé l’adresse DECNet sur chaque PC ?”

    Elle, bien sûr, savait qu’il ne l’avait pas fait. Le journal en disait autant.

    Ingénieur américain : “Euh, non, qu’est-ce que c’est ? Est-ce important ?”

    C’était en effet.

    Le protocole utilisé pour la communication a été conçu pour éviter le piratage. “Il y avait plusieurs commandes de contrôle”, a expliqué Ellen, “pour éliminer toutes les fausses commandes qui pourraient, littéralement, faire exploser une bombe.”

    Dans ce cas, tous les PC avaient désormais la même adresse, ce qui signifie que lorsqu’une communication était tentée (par exemple, une simple demande d’état du réacteur), toutes sortes d’absurdités rebondissaient sur le réseau. Le logiciel du réacteur (ou, pour être clair, la simulation) a décidé que quelque chose de bizarre se produisait et a correctement déclenché ses sécurités. Dans ce cas, un arrêt immédiat.

    Un temps de récupération prolongé (si cela avait été un vrai réacteur) était sans conséquence par rapport à la sécurité face à ce qui pourrait être une attaque.

    “Après avoir expliqué tout cela à la salle désormais silencieuse”, a déclaré Ellen, “j’ai fini par dire au directeur de la production d’énergie que ce n’était pas de notre faute.”

    “C’était quelqu’un, sans mentionner de noms, qui avait démonté notre équipement et avait abusé de nos logiciels et de notre matériel, tout cela avant que nous ne le remettions. Le système a fait exactement ce qu’il était censé faire.”

    “Et même si la simulation d’un brouillage de réacteur ne faisait pas partie des tests, nous savions maintenant que cela fonctionnait.”

    L’entrepreneur américain a fait l’équivalent de tomber sur son épée. Puce-face, il a quitté la pièce, a apparemment été licencié le jour même et emballé dans le prochain avion de retour.

    Encore une fois, ce n’était pas un vrai réacteur et Ellen savait que l’équipe pourrait se remettre en ligne en quelques heures. Cependant, “j’ai menti sans vergogne, j’ai dit à l’équipe réunie qu’il me faudrait au moins deux semaines pour remonter l’équipement, remettre en service tout notre équipement de test et de contrôle, et que je déclarais un cas de force majeure conformément au contrat, mais je ne rapporterait pas les dommages à mon siège social. »

    La salle était remplie d’excuses et de gratitude qu’elle n’irait pas plus loin et qu’il n’y avait eu aucun désagrément. La prolongation de délai ? Pas de problème – il a été accordé.

    L’équipe a terminé bien en avance et des bonus ont été distribués tout au long.

    “Et ça,” dit-elle, “c’est comme ça qu’on m’a accusée d’avoir failli essuyer [region redacted] hors carte.”

    Avez-vous déjà eu vos fesses sauvées par un système de sécurité ? Ou été appelé à une heure indue pour s’occuper de l’erreur de quelqu’un d’autre ? Bien sûr que vous l’avez fait, et vous devriez partager votre histoire avec un e-mail à On Call. ®

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *