Outils pour utilisateurs

Outils du site


technique:monitoring

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
technique:monitoring [2017/07/16 10:43]
lg
technique:monitoring [2020/05/02 10:38] (Version actuelle)
ced117 [Picomon - extra-AS] mises à jour du lien vers le git de check_dns_soa
Ligne 13: Ligne 13:
   * Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs.   * Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs.
   * Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission.   * Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission.
-  * Vérifie l'​état du RAID logiciel sur les deux machines physiques. Voir : [[https://​github.com/​glensc/​nagios-plugin-check_raid|https://github.com/glensc/nagios-plugin-check_raid]].+  * Vérifie l'​état du RAID logiciel sur les deux machines physiques. Voir : [[https://​github.com/​glensc/​nagios-plugin-check_raid|check_raid]],​ [[http://gitlab.netlib.re/arn/arn-confs/​blob/​master/​monitoring/​plugins/​check_raid|Notre version patchée]].
   * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. (check_apt, inclus dans les nagios-plugins).   * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. (check_apt, inclus dans les nagios-plugins).
   * Prévient quand un certificat x509 sur le VPN va expirer. [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ovpn_certs|Check custom]].   * Prévient quand un certificat x509 sur le VPN va expirer. [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ovpn_certs|Check custom]].
   * Agrégation des débits sur les interconnexions externes (transits...).   * Agrégation des débits sur les interconnexions externes (transits...).
   * État des serveurs NTP (en cours d'​exécution,​ état de synchronisation,​ décalage de temps avec la racine de la synchronisation,​...). Avec un [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ntpstat|check custom]].   * État des serveurs NTP (en cours d'​exécution,​ état de synchronisation,​ décalage de temps avec la racine de la synchronisation,​...). Avec un [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ntpstat|check custom]].
-  * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l'​achat de SSD supplémentaires. Voir : [[https://github.com/billcarlson/check_vg_size|https://github.com/billcarlson/check_vg_size]]+  * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l'​achat de SSD supplémentaires. Voir : [[https://exchange.nagios.org/directory/Plugins/​System-Metrics/​Storage-Subsystem/​check_vg/​details|https://exchange.nagios.org/​directory/​Plugins/​System-Metrics/​Storage-Subsystem/check_vg/details]]
   * Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe.   * Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe.
   * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. Avec un [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ucarp|check custom]] crade.   * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. Avec un [[http://​gitlab.netlib.re/​arn/​arn-confs/​blob/​master/​monitoring/​plugins/​check_ucarp|check custom]] crade.
Ligne 33: Ligne 33:
  
 Infos : Infos :
-  * Configuration stockée dans /usr/local/​etc/​picomon/​arn.py+  * Configuration stockée dans /​etc/​picomon/​arn.py
   * Faire prendre en compte la nouvelle configuration : sudo systemctl reload picomon@arn.service   * Faire prendre en compte la nouvelle configuration : sudo systemctl reload picomon@arn.service
   * Voir les checks qui sont en erreur : sudo kill -USR1 <​PID_picomon>​ puis sudo grep "​Signal SIGUSR1 caught"​ -A 75 /​var/​log/​syslog   * Voir les checks qui sont en erreur : sudo kill -USR1 <​PID_picomon>​ puis sudo grep "​Signal SIGUSR1 caught"​ -A 75 /​var/​log/​syslog
Ligne 41: Ligne 41:
 Ce qui est surveillé : Ce qui est surveillé :
   * Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets)   * Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets)
-  * Vérification des zones DNS ''​arn-fai.net''​ et ''​netlib.re''​ grâce à l'​outil [[https://github.com/​bortzmeyer/​check_dns_soa|de Bortzmeyer]]. Vérification que le serveur qui fait autorité n'est pas un récursif ouvert.  +  * Vérification des zones DNS ''​arn-fai.net''​ et ''​netlib.re''​ grâce à l'​outil [[https://framagit.org/​bortzmeyer/​check_dns_soa/|de Bortzmeyer]]. Vérification que le serveur qui fait autorité n'est pas un récursif ouvert.  
-  * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais+  * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais ​(check_smtp de nagios_plugins)
   * Réponse correcte du serveur VPN (avec ce check : https://​github.com/​liquidat/​nagios-icinga-openvpn/​ )   * Réponse correcte du serveur VPN (avec ce check : https://​github.com/​liquidat/​nagios-icinga-openvpn/​ )
-  * Atteignabilité,​ code HTTP et contenu correct des applications web principales (adherents, site web principal, mailing-lists,​ looking glass, pad, netlib.re, wiki). ​+  * Atteignabilité,​ code HTTP et contenu correct des applications web principales (adherents, site web principal, mailing-lists,​ looking glass, pad, netlib.re, wiki) (avec check_http de nagions_plugins) 
 +  * Expiration des [[technique:​x509|certificats x509]] (check_http -C).
  
  
technique/monitoring.1500194585.txt.gz · Dernière modification: 2017/07/16 10:43 par lg