Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
technique:monitoring [2016/05/08 20:13] johndescs map zabbix |
technique:monitoring [2020/05/02 10:38] (Version actuelle) ced117 [Picomon - extra-AS] mises à jour du lien vers le git de check_dns_soa |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ==== Monitoring ==== | + | ====== Monitoring |
- | === Zabbix | + | Nos checks internes de monitoring sont disponibles sur notre [[http:// |
- | Installé dans le LXC zabbix sur la VM ' | ||
+ | ===== Zabbix - intra-AS ===== | ||
+ | |||
+ | Infos : | ||
+ | * Installé dans le LXC zabbix sur la VM ' | ||
+ | * Configuration via l' | ||
+ | |||
+ | Ce qui est surveillé : | ||
* Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs. | * Remonte les valeurs par SNMP de partout (VM, conteneurs LXC) en auto-découverte selon les axes principaux : disques, interfaces réseau, processeurs. | ||
* Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission. | * Surveille et alerte si le récursif DNS ouvert dépasse un certain seuil de débit en émission. | ||
- | * Vérifie l' | + | * Vérifie l' |
- | * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. | + | * Prévient lorsque des mises à jour logicielles (APT) sont disponibles. (check_apt, inclus dans les nagios-plugins). |
- | * Prévient quand un certificat x509 sur le VPN va expirer. | + | * Prévient quand un certificat x509 sur le VPN va expirer. [[http:// |
* Agrégation des débits sur les interconnexions externes (transits...). | * Agrégation des débits sur les interconnexions externes (transits...). | ||
- | * État des serveurs NTP (en cours d' | + | * État des serveurs NTP (en cours d' |
- | * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l' | + | * Alerte quand la place disponible dans le VG LVM des machines physiques vient à manquer, histoire de planifier l' |
* Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe. | * Alerte si l'une des sessions BGP (IPv4 ou IPv6) tombe. | ||
- | * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. | + | * Alerte si les démons uCARP sont morts ou plantés ou qu'un fallback a eu lieu. Avec un [[http:// |
* Alerte si une des instances DRBD est dans un état différent de l' | * Alerte si une des instances DRBD est dans un état différent de l' | ||
Ligne 21: | Ligne 27: | ||
Pour l' | Pour l' | ||
- | === Picomon - extra-AS === | + | |
+ | ===== Picomon - extra-AS | ||
Petit outil minimaliste pour surveiller des services réseau à distance sous forme de programmes / scripts à exécuter régulièrement : http:// | Petit outil minimaliste pour surveiller des services réseau à distance sous forme de programmes / scripts à exécuter régulièrement : http:// | ||
+ | Infos : | ||
+ | * Configuration stockée dans / | ||
+ | * Faire prendre en compte la nouvelle configuration : sudo systemctl reload picomon@arn.service | ||
+ | * Voir les checks qui sont en erreur : sudo kill -USR1 < | ||
+ | * Un récapitulatif des checks en erreur est envoyé par mail quotidiennement. | ||
+ | |||
+ | |||
+ | Ce qui est surveillé : | ||
* Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets) | * Ping des machines et des BMC à distance (vérifie la connectivité réelle depuis un autre bout des Internets) | ||
- | * Vérification des zones DNS '' | + | * Vérification des zones DNS '' |
- | * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais | + | * Vérification du fonctionnement des serveurs mail de l'asso : accepte une adresse chez nous, et refuse de servir de relais |
- | * Réponse correcte du serveur VPN | + | * Réponse correcte du serveur VPN (avec ce check : https:// |
- | * Atteignabilité, | + | * Atteignabilité, |
+ | * Expiration des [[technique: | ||