Syst�mes-R�seaux

PacemakerEtCorosync

Introduction
Pacemaker un un outils serveur qui g�re des ressources (une VIP, un service) pour vos cluster. Son r�le principale c'est de g�rer la haute disponibilit�

 en s'occupant de leur d�marrage, red�marrage, arr�t. La communication entre vos noeuds et la gestion du cluster en lui-m�me seront assur�es par une brique d�di�e 
 comme par exemple Corosync. Son r�le est de se charger du heartbeat (battement de c�ur de notre cluster) et d'avertir Pacemaker du changement d��tat des 
 n�uds.

 Il faut �galement garder en t�te que le fait d'avoir un cluster pour le service DHCP n'exclut pas d'avoir des probl�mes. Un cluster peut se trouver confront� � 
 un probl�me de taille : le split-brain. C'est le principal probl�me � �viter.

 Le split-brain peut intervenir quand chaque n�ud de votre cluster croit son voisin hors service. Il va alors prendre la main : chaque n�ud est donc ma�tre et 
 fournit le service. Les effets de bords peuvent �tre g�nants d�s lors qu�on utilise une ressource partag�e.

 Pour se prot�ger un maximum de ce probl�me, il est fortement recommand� d�utiliser deux liens r�seau diff�rents pour la communication entre les n�uds (ou de faire du 
 bonding, agr�gation de plusieurs Interfaces r�seaux en une Interface logique).

 Installation d'un Cluster qui contiendra deux serveurs physiques pour assurer les services de routage d'un r�seau NAT (192.168.1.0/24) et d'un '''service 
 DHCP''' pour les clients natter.

Installation :

 # apt-get install corosync

 # apt-get install pacemaker

 # apt-get install crmsh

Crmsh est un CLI permettant de configurer votre Cluster.

 Avant d'effectuer la configuration, ouvrir les ports n�cessaires � Corosync et autoriser le multicast :

 # iptables -A INPUT -p udp --dport 5404 -j ACCEPT
 # iptables -A INPUT -p udp --dport 5405 -j ACCEPT
 # iptables -A INPUT -m pkttype --pkt-type multicast -j ACCEPT
 # iptables-save > /etc/iptables_rules.save

Configuration de Corosync :
Editez le fichier de configuration de Corosync.

Remarque :

 Ce fichier doit �tre le m�me sur l'ensemble de vos n�uds. Lorsque la configuration du fichier sera termin�, une copie sera n�cessaire sur l'autre n�ud.

 # vi /etc/corosync/corosync.conf

 totem {
      version: 2
      threads: 0
      cluster_name: ntp_route
      token: 5000
      token_retransmits_before_loss_const: 20
      join: 1000
      consensus: 7500
      max_messages: 20
      secauth: on # On utilise une cl� pour autoriser un n�ud � se connecter au cluster.

      interface {
               ringnumber: 0
               bindnetaddr: 192.168.1.0
               mcastaddr: 226.94.1.1
               mcastport: 5405
               ttl: 1
      }
 }

      logging {
             to_logfile: yes
             logfile: /var/log/corosync/corosync.log
             to_syslog: yes
             debug: off
	     timestamp: on
	     logger_subsys {
		          subsys: QUORUM
		          debug: off
	     }
 }

 quorum {
       provider: corosync_votequorum
       expected_votes: 2
 }

 Pour �viter le split-brain, il faut d�clarer une deuxi�me interface.
 Pour ce faire, ajoutez un deuxi�me bloc "interface", incr�mentez-le "ringnumber" et renseignez l�adresse de votre deuxi�me r�seau ainsi qu�une nouvelle  
 adresse de multicast. Il faudra positionner le "rrp_mode" � active. Vos deux interfaces r�seau fonctionneront en m�me temps. Si vous mettez le 
 "rrp_mode" � passive. La deuxi�me interface r�seau ne s�activera que si la premi�re est en �chec.

Exemple :

 rrp_mode: active
 interface {
   ringnumber: 0
   bindnetaddr: 194.214.124.0
   mcastaddr: 226.94.1.1
   mcastport: 5405
 }

 interface {
   ringnumber: 1
   bindnetaddr: 192.168.1.0
   mcastaddr: 226.94.2.1
   mcastport: 5405
 }

Remarque :
Si une des deux interfaces r�seaux ne fonctionnent pas, vous aurez un message d'erreur dans les logs :

 [TOTEM ] Marking seqid 3608 ringid 1 interface 192.168.0.2 FAULTY
 administrative intervention required.

 La commande suivante, permet de donner l'�tat de vos interfaces :

Int�gration de Pacemaker et activation de corosync :
En premier, cr�er le r�pertoire /etc/corosync/service.d/

 # mkdir /etc/corosync/service.d/

 Nous allons maintenant ajouter le service Pacemaker dans notre cluster Corosync.
 A la fin du fichier /etc/corosync/corosync.conf, ajoutez les lignes suivantes :
 service {
 # Load the Pacemaker Cluster Resource Manager
 name: pacemaker
 ver: 1
 }

 Activation du service corosync :
 Positionnez le param�tre START � yes du fichier /etc/default/corosync :
 START=yes

 dans le m�me fichier, d�commentez les lignes suivantes :

 D�marrez le service corosync
 # systemctl start corosync

Authentification :

 Lors de l'installation de Corosync, une cl� a �t� g�n�r� pour permettre l'authentification de vos noeuds.
 Nous allons �craser cette cl� et en construisant sur le noeud PRIMAIRE la cl� � partager entre les noeuds du cluster (en utilisant le paquet haveged).
 Sur le serveur PRIMAIRE :
 PRIMAIRE# apt-get install haveged
 PRIMAIRE# corosync-keygen
 PRIMAIRE# chown root:root /etc/corosync/authkey
 PRIMAIRE# chmod 400 /etc/corosync/authkey

 A partir du serveur PRIMAIRE, vous pouvez d�sinstaller le paquet haveged et copiez la cl� vers le serveur SECONDAIRE :
 PRIMAIRE# apt-get remove --purge haveged
 PRIMAIRE# apt-get autoremove
 PRIMAIRE# apt-get clean
 PRIMAIRE# scp /etc/corosync/authkey user@SECONDAIRE:/tmp
 SECONDAIRE# mv /tmp/authkey /etc/corosync
 SECONDAIRE# chown root:root /etc/corosync/authkey
 SECONDAIRE# chmod 400 /etc/corosync/authkey

 A la fin du fichier /etc/corosync/corosync.conf ajoutez une section nodelist. Le nom des noeuds est r�cup�r� par la 
 commande uname -a | awk '{print $2}'

 nodelist {
        node {
                  ring0_addr: 194.214.124.89
                  name: nat1
                  node: 1
        }
       node {
                ring0_addr: 194.214.124.94
                name: nat2
                node: 2
       }
 }

 A partir de ce moment, votre cluster est d�marr�. Vous pouvez vous connecter au moniteur de Pacemaker via la commande crm_mon -1.
 Cependant, le cluster n'est pas encore op�rationnel dans le cas d'une d�faillance mat�riel ou logiciel d'un des serveurs. Pour cela, il faut activer 
 stonithd.

Le servcie PACEMAKER

cib : Cluster Information Base, g�re la base de configuration et d�information du cluster. C�est par lui que la configuration est modifi�e et synchronis�e sur l�ensemble des n�uds.
crmd : Cluster Resource Management Daemon, est un service qui, lorsqu�il est �lu ma�tre, ordonne l�activit� du cluster dont l�arr�t et la relance des ressources.
pengine : calcule � chaque instant et selon les informations qu�il re�oit de crmd le prochain �tat du cluster selon un graphe d�actions et de d�pendances entre celles-ci.
stonithd : Shoot The Other Node In The Head Daemon, qui permet d��teindre m�caniquement un n�ud jug� indisponible.
lrmd : Local Resource Management Daemon, interface entre le cluster et les ressources locales avec lesquelles il interagit, notamment via des scripts.
attrd : Attributes Daemon, qui permet de modifier les attributs d�un n�ud.

 Dans les logs, tail -f /var/log/corosync/corosync.conf, vous pourrez voire le bon fonctionnement du cluster, �galement lors d'une v�rification 
 du status de Corosync, systemctl status corosync

 La commande ps va nous permettre de retrouver ces processus, ici avec "version" � 1 dans le fichier /etc/corosync/corosync.conf :

 # ps -e f

Surveiller l'�tat du Cluster :

 La commande crm_mon est un moniteur en temps r�el pour afficher l��tat du cluster. Avec cette outil vous allez retrouver la liste des n�uds, leur �tat, 
 le nom du coordinateur d�sign� (DC), le hearbeat utilis�, etc.
 # crm_mon -1

Voir la configuration initiale de PACEMAKER :

 # crm config show

 # crm config show xml

 ATTENTION ! Veillez � ne JAMAIS modifier le fichier de configuration /var/lib/heartbeat/crm/cib.xml � la main. C�est une r�gle 
 de base.

Param�trage du Cluster :

 Attribution d'une adresse IP virtuelle au cluster.
 Nous utiliserons la cli CRM (Cluster Resource Manager) pour cr�er notre configuration du cluster. 
 # crm
 crm(live)# cib new ma-config-cluster
 INFO: cib.new: ma-config-cluster shadow CIB created

 On d�sactive STONITH. Dans notre cas, STONITH est une fonction de s�curit� des donn�es lors du basculement entre les deux serveurs d'un cluster. Il est 
 garant de l�int�grit� des donn�es � chaque bascule. 
 Ici nous n�en avons pas besoin pour un cluster de serveur NAT/DHCP.
 crm(ma-config-cluster)# configure 
 crm(ma-config-cluster)configure# property stonith-enabled=false

 Et enfin on assigne une adresse IP virtuelle au cluster et on g�re la bascule entre les noeuds :
 crm(ma-config-cluster)configure# primitive failover-ip ocf:heartbeat:IPaddr params ip=192.168.1.2 op monitor interval=10s

Descriptions des arguments :

primitive, argument pour ajouter une primitive. Mais une primitive c�est quoi ? Un param�tre renseignant plusieurs valeurs indiquant au cluster quels scripts utiliser pour la resource, o� le trouver et � quel standard il correspond.
failover-ip est le nom de la primitive
ocf, classe de la resource
hearbeat, provider de la resource
IPaddr, RA (Resource Agent) g�rant les adresses IPv4 virtuelles
params, d�claration des param�tres
ip=192.168.1.2, IP du failover
op, les options
monitor, action � effectuer, ici le monitoring de la ligne de vie
interval=10s, on d�finit l�interval auquel on effectue l�action de monitoring.

 On v�rifie et valide les commandes :
 crm(ma-config-cluster)configure# verify
 crm(ma-config-cluster)configure# end
 There are changes pending. Do you want to commit them? y
 crm(ma-config-cluster)#
 crm(ma-config-cluster)# cib use live
 crm(live)# cib commit ma-config-cluster
 INFO: commited 'ma-config-cluster' shadow CIB to the cluster
 crm(live)# quit
 bye

 Le cluster est maintenant activ� et fonctionnel !
 # crm_mon --one-shot -V

 # crm_mon -1

 Nettoyage du message Actions ayant �chou� dans la configuration du cluster Pacemaker / Corosync.
 # crm_mon -1

 Pour supprimer les erreurs, ex�cutez la commande suivante :
 # crm_resource -P

Sur le serveur secondaire :

 S'assurer que la cl� authkey a bien �t� copi� sur le serveur secondaire avec comme utilisateur et groupe root et avec les droits 400.
 # ls -l /etc/corosync

 Red�marrez les services pacemaker et corosync :
 # systemctl restart pacemaker
 # systemctl restart corosync
 # update-rc.d pacemaker defaults
 # crm_mon -1

Tester le basculement de l�IP sur le second noeud :

 Positionnez le noeud midir en standbye :
 # crm node standby midir

Autres documentations :

 C�est une commande incontournable pour r�cup�rer � n�importe quel moment l��tat du cluster. Il peut g�n�rer du html, propose une interface cgi, peut dialoguer avec 
 d�autres outils de monitoring (centreon, nagios�). Le param�tre -1 permet d�obtenir une seule sortie :
 STONITH
 Comme son nom l'indique, STONITH cl�ture les noeuds d�faillants en r�initialisant ou en mettant hors tension le noeud d�faillant.

 Une contention � plusieurs n�uds avec un risque d'erreurs dans un cluster peut avoir des r�sultats catastrophiques, par exemple si les deux n�uds essayent d'�crire  
 sur une ressource de stockage partag�e. STONITH fournit une protection efficace, assez drastique contre ces probl�mes.

 Les syst�mes � n�ud unique utilisent un m�canisme comparable appel� un chien de garde. Un temporisateur de surveillance r�initialisera le n�ud si celui-ci ne dit pas 
 au circuit de surveillance qu'il fonctionne bien. Une d�cision STONITH peut �tre bas�e sur diverses d�cisions qui peuvent �tre des plugins sp�cifiques au 
 client.

 # crm_attribute --attr-name stonith-enabled --attr-value true
 # cibadmin -Q | grep stonith

Wiki agc88.fr

PacemakerEtCorosync