Outils pour utilisateurs

Outils du site


technique:monitoring

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
technique:monitoring [2017/07/16 10:43]
lg
technique:monitoring [2020/05/02 10:38] (Version actuelle)
ced117 [Picomon - extra-AS] mises à jour du lien vers le git de check_dns_soa
Ligne 13: Ligne 13:
   * Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs.   * Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs.
   * Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission.   * Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission.
-  * Vérifie l'état du RAID logiciel sur les deux machines physiques. Voir : [[https://github.com/glensc/nagios-plugin-check_raid|https://github.com/glensc/nagios-plugin-check_raid]].+  * Vérifie l'état du RAID logiciel sur les deux machines physiques. Voir : [[https://github.com/glensc/nagios-plugin-check_raid|check_raid]], [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_raid|Notre version patchée]].
   * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. (check_apt, inclus dans les nagios-plugins).   * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. (check_apt, inclus dans les nagios-plugins).
   * Prévient quand un certificat x509 sur le VPN va expirer. [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ovpn_certs|Check custom]].   * Prévient quand un certificat x509 sur le VPN va expirer. [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ovpn_certs|Check custom]].
   * Agrégation des débits sur les interconnexions externes (transits...).   * Agrégation des débits sur les interconnexions externes (transits...).
   * État des serveurs NTP (en cours d'exécution, état de synchronisation, décalage de temps avec la racine de la synchronisation,...). Avec un [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ntpstat|check custom]].   * État des serveurs NTP (en cours d'exécution, état de synchronisation, décalage de temps avec la racine de la synchronisation,...). Avec un [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ntpstat|check custom]].
-  * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l'achat de SSD supplémentaires. Voir : [[https://github.com/billcarlson/check_vg_size|https://github.com/billcarlson/check_vg_size]]+  * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l'achat de SSD supplémentaires. Voir : [[https://exchange.nagios.org/directory/Plugins/System-Metrics/Storage-Subsystem/check_vg/details|https://exchange.nagios.org/directory/Plugins/System-Metrics/Storage-Subsystem/check_vg/details]]
   * Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe.   * Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe.
   * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. Avec un [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ucarp|check custom]] crade.   * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. Avec un [[http://gitlab.netlib.re/arn/arn-confs/blob/master/monitoring/plugins/check_ucarp|check custom]] crade.
Ligne 33: Ligne 33:
  
 Infos : Infos :
-  * Configuration stockée dans /usr/local/etc/picomon/arn.py+  * Configuration stockée dans /etc/picomon/arn.py
   * Faire prendre en compte la nouvelle configuration : sudo systemctl reload picomon@arn.service   * Faire prendre en compte la nouvelle configuration : sudo systemctl reload picomon@arn.service
   * Voir les checks qui sont en erreur : sudo kill -USR1 <PID_picomon> puis sudo grep "Signal SIGUSR1 caught" -A 75 /var/log/syslog   * Voir les checks qui sont en erreur : sudo kill -USR1 <PID_picomon> puis sudo grep "Signal SIGUSR1 caught" -A 75 /var/log/syslog
Ligne 41: Ligne 41:
 Ce qui est surveillé : Ce qui est surveillé :
   * Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets)   * Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets)
-  * Vérification des zones DNS ''arn-fai.net'' et ''netlib.re'' grâce à l'outil [[https://github.com/bortzmeyer/check_dns_soa|de Bortzmeyer]]. Vérification que le serveur qui fait autorité n'est pas un récursif ouvert.  +  * Vérification des zones DNS ''arn-fai.net'' et ''netlib.re'' grâce à l'outil [[https://framagit.org/bortzmeyer/check_dns_soa/|de Bortzmeyer]]. Vérification que le serveur qui fait autorité n'est pas un récursif ouvert.  
-  * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais+  * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais (check_smtp de nagios_plugins)
   * Réponse correcte du serveur VPN (avec ce check : https://github.com/liquidat/nagios-icinga-openvpn/ )   * Réponse correcte du serveur VPN (avec ce check : https://github.com/liquidat/nagios-icinga-openvpn/ )
-  * Atteignabilité, code HTTP et contenu correct des applications web principales (adherents, site web principal, mailing-lists, looking glass, pad, netlib.re, wiki). +  * Atteignabilité, code HTTP et contenu correct des applications web principales (adherents, site web principal, mailing-lists, looking glass, pad, netlib.re, wiki) (avec check_http de nagions_plugins) 
 +  * Expiration des [[technique:x509|certificats x509]] (check_http -C).
  
  
technique/monitoring.1500194585.txt.gz · Dernière modification: 2017/07/16 10:43 de lg