Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Azure Stack
  3. Pour aller plus loin
Extrait - Azure Stack Déployez le portail Cloud Azure sur votre Datacenter
Extraits du livre
Azure Stack Déployez le portail Cloud Azure sur votre Datacenter Revenir à la page d'achat du livre

Pour aller plus loin

Introduction

Dans ce chapitre, nous abordons des cas particuliers, par exemple la réinstallation complète de l’ASDK ou quelques actions de dépannage. Quelques cas courants sont exposés, ce sont souvent des retours d’expériences, des bonnes pratiques pour faciliter la maintenance. Le gestionnaire d’événements dédiés Azure Stack est également présenté.

Les informations de dépannage sont aussi disponibles sur le site de l’éditeur et actualisées régulièrement. Elles sont mises à jour au fur et à mesure de l’évolution des versions.

En fin de chapitre, quelques opérations de maintenance courante sont expliquées. Comme tout système, le kit de déploiement nécessite des opérations de maintien en condition opérationnelle. Le client doit pouvoir profiter d’une plateforme performante, à jour de version et également pouvoir bénéficier d’un socle fiable, sauvegardé et restauré si nécessaire.

Ces opérations sont à la charge exclusive de l’opérateur. Un bilan de santé intègre aussi le suivi de la mesure des ressources disponibles pour favoriser une bonne planification.

Bilan de santé

Réaliser un bilan de santé de l’état des ressources est indispensable. Ce dernier concerne trois points sensibles qui conditionnent le bon fonctionnement de l’ASDK : l’état matériel de la machine physique, l’état des ressources disponibles ainsi que l’état logiciel du Stack.

L’opérateur doit prendre les devants et ne pas attendre les blocages. Par une surveillance adaptée, il décide des actions à court, moyen et long terme. Comme dans un environnement sur site, les actions de MCO (maintien en condition opérationnelle) sont des opérations préventives qui garantissent une utilisation optimale de l’environnement.

1. État de santé de la machine physique

L’état de santé de la machine physique doit être scruté régulièrement. Qu’il s’agisse de systèmes de test et même s’il n’y a pas de supervisions dédiées à la machine, l’opérateur prendra soin de lancer une fois par semaine les outils de diagnostic du fournisseur de matériel, notamment pour le contrôle des disques, ou pour détecter toutes les alertes matérielles. L’exemple le plus courant est l’alerte disque de type échec prévu qui informe d’une panne imminente sur le matériel. Si possible, l’opération de maintenance doit être préventive sans attendre la casse définitive.

Voici quelques bonnes pratiques applicables à Windows Server :

  • Consultez les journaux d’évènements pour rechercher les alertes de volumes disques.

  • Contrôler régulièrement les informations visuelles d’alertes sur les disques, par exemple les clignotements orange ou rouge sur un disque de la baie ou toute autre activité inhabituelle.

  • Tenir en stock au moins un disque d’avance pour pièce si le serveur ne bénéficie...

Journaux d’événements

Les journaux d’événements sont indispensables pour assurer le dépannage. L’analyse d’informations dans le journal est le préalable à toute opération de diagnostic pour le système et les applications. L’ASDK n’échappe pas à cette règle.

Il existe plusieurs journaux dédiés pour Azure Stack visibles au sein de l’Observateur d’événements : Applications and Services Logs / AzureStackFabricHealth, Applications and Services Logs / Microsoft / AzureStack / BlobService, Applications and Services Logs / MicrosoftAzureStackTraceCollector.

images/13EP05.PNG

Les journaux d’événements dédiés à la supervision Azure Stack

1. AzureStackFabricHealth

Azure Service Fabric contrôle l’intégrité des services en temps réel. C’est le composant central de gestion des événements. L’intégrité est vérifiée pour les composants suivants :

  • Clusters et nœuds.

  • Applications, applications déployées et packages de services.

  • Services.

  • Réplicas et partitions.

Un exemple de contrôle d’intégrité réalisé en deux phases :

EventID 0, Starting monitor: Local disk space monitor. 
EventID 0, Completed monitor: Local disk space monitor 

Un exemple de remontée...

Sauvegarder son Azure Stack

La sauvegarde est une opération indispensable. Même en environnement de test, ce n’est pas une option. L’installation complète d’un kit ASDK est comprise entre 6 et 12 h, seule la sauvegarde de l’infrastructure garantie un redémarrage rapide en cas de dysfonctionnement grave. Après la réalisation d’une première sauvegarde, des alertes sont affichées dans le tableau de bord central pour informer l’opérateur du résultat de ses sauvegardes comme expliqué en section Suivi des sauvegardes en cas d’arrêt de l’environnement de ce chapitre.

Le seul périphérique de sauvegarde autorisé est un partage réseau. Les chemins UNC (Universal Naming Convention) sont utilisés.

Les premières sauvegardes occupent environ 5 Go d’espace disque, l’espace moyen est de 10 Go. Les paramètres de sauvegarde sont présentés dans la section Configuration de la sauvegarde de ce chapitre. L’espace nécessaire est directement lié aux paramètres choisis. Les valeurs sont les suivantes :

  • La valeur Backup frequency in hours est comprise entre 4 et 12 heures.

  • La valeur Retention period in days entre 2 et 14 jours.

Le calcul pour la valeur minimale est donc :

(24 heures/Backup frequency in hours) x Retention period in days x Volume de la sauvegarde.

Soit 24/12 x 2 x 10 Go = 40 Go

Le même calcul pour la valeur maximale :

24/4 x 14 x 10 Go = 840 Go

L’espace disponible dédié doit être adapté au choix de la fréquence et de la conservation des sauvegardes.

La sauvegarde est une sauvegarde d’infrastructure excluant donc les données utilisateurs. Lors de la restauration, seuls les paramètres d’Azure Stack sont restaurés.

1. Prérequis à l’exécution des sauvegardes

Deux opérations de préparation sont à mener en préalable à la réalisation de sauvegarde :

  • La mise à disposition d’un partage sur le périphérique dédié.

  • Un certificat de cryptage pour protéger les données de sauvegardes.

a. Partage dédié à la sauvegarde

La sauvegarde doit être réalisée sur un partage réseau....

Restaurer l’ASDK

La restauration de l’ASDK ne prend pas en charge les données utilisateurs. Elle est simplement utile pour récupérer les données de gestion de l’infrastructure, par exemple, les plans et les offres. Elle est ici présentée de façon théorique sans mise en œuvre.

Il y a deux phases principales pour effectuer la restauration :

  • Tout d’abord, la préparation de la machine pour l’installation de l’ASDK comme expliqué dans la section Installation du kit de déploiement, du chapitre Installer Azure Stack. Puisque la sauvegarde est une sauvegarde de paramètres, elle s’appuie sur la réinstallation du Stack depuis le fichier CloudBuilder.vhdx de base. C’est donc un mécanisme de réinstallation complète.

Attention, il n’est pas possible de restaurer une version différente de l’ASDK. Si la version installée est la 19.08, il est impossible de télécharger une version 19.10 et d’y appliquer la sauvegarde.

En fin d’opération de paramétrage, la machine redémarre.

  • La seconde phase est la préparation d’un répertoire sur lequel sont copiés les derniers dossiers des sauvegardes. Microsoft propose pour cela un script adapté.

Dans une fenêtre PowerShell avec élévation de privilège....

Dépanner le démarrage

L’ASDK s’initialise automatiquement dès lors que la machine physique démarre ou redémarre. Si les treize machines ne sont pas opérationnelles après 1 à 3 heures (un peu plus si la machine physique est au minimum de la configuration conseillée), il faudra contrôler les étapes de lancement. Il ne faut surtout jamais redémarrer l’environnement sans réaliser un diagnostic complet des points bloquants le démarrage.

Même si le démarrage des treize machines virtuelles est terminé, il est possible et même probable que le portail opérateur ou le portail utilisateur ne soit pas accessible immédiatement. Avant de pousser plus loin le dépannage, il faut attendre encore une quinzaine de minutes après le démarrage de la dernière machine avant de lancer ce dernier. Si cette durée est écoulée et que ce dernier n’est toujours pas accessible, le test de contrôle suivant doit être lancé.

1. Contrôle complet

Les deux premières machines qui s’exécutent sont le contrôleur de domaine AzS-DC01 puis le point de terminaison et d’administration AzS-ERCS01. Si ces deux systèmes ne démarrent pas, il n’est pas possible de vérifier le statut de démarrage au travers des scripts de diagnostic de l’ASDK. Si le cas se présente, il est vraisemblable que le problème soit lié à la pile de virtualisation. La section Journaux d’événements de ce chapitre aborde le sujet du gestionnaire d’événements Hyper-V.

Pour donner quelques informations concrètes sur le sujet, voici un exemple rencontré sur la maquette du livre.

45 minutes après le démarrage, impossible de lancer le portail opérateur. Sur la console Hyper-V, les trois premières machines qui doivent démarrer sont en état « désactivé »....

Réinstaller l’ASDK

Très rarement, il peut être nécessaire de redéployer le kit afin de repartir sur une base vierge, de corriger un environnement en panne (exemple d’un problème matériel majeur) ou bien pour installer une version plus récente de l’ASDK. Pour rappel, au moment où ce livre est écrit, Microsoft ne propose pas de mise à jour du kit, la réinstallation est obligatoire. Attention, cette opération de réinstallation détruit l’installation existante.

1. Désinscription

Si l’ASDK a été relié à un abonnement Azure (voir le chapitre Connecter son abonnement), il est obligatoire de délier l’environnement du compte existant. Ces opérations sont exécutées après avoir importé le module PowerShell dédié à l’enregistrement/désenregistrement du kit.

Ce module est installé en phase de postdéploiement, il a déjà été utilisé pour l’enregistrement.

Dans une fenêtre PowerShell avec élévation de privilège.

 Importez le module :

Import-Module C:\AzureStack-Tools-master\Registration\
RegisterWithAzure.psm1 

 Saisissez Add-AzureRmAccount qui lance la fenêtre d’authentification. Utilisez le compte et mot de passe de connexion à l’abonnement (voir le chapitre Connecter son abonnement, section Créer un compte Azure (offre gratuite)). 

 Lancez la commande :

$CloudAdminCred = Get-Credential -UserName AZURESTACK\CloudAdmin -Message 
"Enter the cloud domain credentials to access the privileged endpoint" 

puis renseignez le mot de passe du compte dans la fenêtre d’authentification....

Maintenance courante

1. Mise à jour du socle

L’ASDK ne se met pas à jour depuis l’interface de gestion contrairement à la version commerciale d’Azure Stack.

La mise à jour est régulièrement proposée dans le portail, cependant elle est impossible.

Si la mise à jour est lancée depuis le portail, elle se termine systématiquement en erreur. Les relances sont possibles, mais se solderont toutes par une erreur. L’ASDK est définitivement hors de service !

Pour mettre à jour son kit de déploiement, il n’y a pas d’autres solutions que de réinstaller entièrement le socle. C’est donc une opération destructive.

Les notes de versions proposent un résumé des corrections et évolutions sur le site de l’éditeur (https://docs.microsoft.com/fr-fr/azure-stack/operator/azure-stack-servicing-policy). L’opérateur s’appuie sur ce document pour décider de réinstaller son ASDK ou de le conserver si les modifications et améliorations apportées sont mineures.

Cette information est valable au 4 août 2019, le mécanisme de mise à jour peut évoluer au fil du temps.

2. Mise à jour système

a. Machine physique

Le système d’exploitation de la machine physique doit être mis à jour régulièrement. C’est...

Dépanner le téléchargement de la place de marché

Cette section offre une solution lorsque le téléchargement depuis la place de marché ne fonctionne pas. Il arrive parfois qu’un élément soit en état Failed lors du téléchargement et les informations d’échec ne sont pas utilisables. Les relances sur ce même paquet ne donnent pas de résultat.

Dans les sources d’installation annexes utilisées par l’ASDK se trouve un répertoire C:\AzureStack-Tools-master\. C’est un ensemble d’outils téléchargés dans la section Vérification d’installation du chapitre Installer Azure Stack.

Dans ce répertoire, le dossier Syndication contient le module AzureStack. MarketplaceSyndication.psm1 qui prend en charge les opérations de la place de marché comme indiqué dans le synopsis du module :

    .SYNOPSIS 
    List all Azure Marketplace Items available for syndication  
and allows to download them 
    Requires an Azure Stack System to be registered for the  
subscription used to login 

Liste et téléchargement pour ce module

Les opérations d’affichage de modules et de prise en charge du téléchargement sont possibles avec PowerShell.

Pour accélérer et fiabiliser les téléchargements, l’exécutable Azcopy doit être disponible sur la machine. Téléchargez la dernière version de l’outil après une recherche Internet sous le terme Bien démarrer avec AzCopy. Cette recherche doit mener sur le lien : https://docs.microsoft.com/fr-fr/azure/storage/common/storage-use-azcopy-v10

 Téléchargez la version Windows 64 bits. Décompressez le fichier azcopy.exe dans le répertoire C:\Windows\System32...