Outils pour utilisateurs

Outils du site


technique:monitoring

Ceci est une ancienne révision du document !


Monitoring

Zabbix - intra-AS

Installé dans le LXC zabbix sur la VM 'int', avec sa propre BDD MySQL locale.

  • Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs.
  • Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission.
  • Vérifie l'état du RAID logiciel sur les deux machines physiques. Voir : https://github.com/glensc/nagios-plugin-check_raid.
  • Prévient lorsque des mises à jour logicielles (APT) sont disponibles.
  • Prévient quand un certificat x509 sur le VPN va expirer.
  • Agrégation des débits sur les interconnexions externes (transits…).
  • État des serveurs NTP (en cours d'exécution, état de synchronisation, décalage de temps avec la racine de la synchronisation,…).
  • Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l'achat de SSD supplémentaires. Voir : https://github.com/billcarlson/check_vg_size
  • Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe.
  • Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu.

Pour l'installation/configuration, voir : zabbix

Picomon - extra-AS

Petit outil minimaliste pour surveiller des services réseau à distance sous forme de programmes / scripts à exécuter régulièrement : http://gitlab.netlib.re/arn/picomon

  • Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets)
  • Vérification des zones DNS arn-fai.net et netlib.re grâce à l'outil de Bortzmeyer. Vérification que le serveur qui fait autorité n'est pas un récursif ouvert.
  • Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais
  • Réponse correcte du serveur VPN
  • Atteignabilité, code HTTP et contenu correct des applications web principales (adherents, site web principal, looking glass, pad, netlib.re, wiki).
technique/monitoring.1460048265.txt.gz · Dernière modification: 2016/04/07 18:57 par lg