Pour superviser l'ensemble de vos équipements et de vos serveurs, nous vous proposons une solution simple, efficace, éprouvée et extensible.
1. Qu'est-ce que superviser ?
Superviser, c'est vérifier régulièrement et systématiquement le bon fonctionnement d'un service, d'un équipement et, en cas de dysfonctionnement, tenter une action correctrice ou alerter les personnes compétentes capables de rétablir la situation.
2. Qualités nécessaires
Qu'attendre d'un système de supervision ?
- Qu'il déclenche des alarmes sur des dysfonctionnements de service qui sont de réels dysfonctionnements.
- Qu'il ne déclenche pas d'alarme sur des dysfonctionnements de service qui ne sont pas de réels dysfonctionnements.
Les points précédents peuvent paraître évidents. Ils sont rarement atteints par les produits de supervision du marché.
Le corollaire des ces deux qualités est que le système de supervision doit pouvoir effectuer les mêmes requêtes que les clients ``normaux'' depuis un poste distant.
Qu'attendre d'autre ?
- Qu'il s'adapte aux différents comportements diurnes/nocturnes, jours ouvrés/fériés de l'équipe de supervision. Par exemple, le déclenchement des alertes doit être plus sensible le jour que la nuit.
- Qu'il soit facilement extensible. La supervision d'un parc réseau est un travail adaptatif. Il n'existe pas et il n'existera jamais un système de supervision universel capable de répondre à tous les problèmes. Pour la simple raison qu'il est impossible de tout prévoir.
- Qu'il trace des données permettant de visualiser la disponibilité des services sur des échelles de temps différents.
3. Quels types de services ou équipement ?
- Les services Internet et Intranet
- les services du réseau local (LAN)
- surveillance de serveurs de fichiers NT, Samba.
- amorçage des machines
- espace libre sur les disques durs, les partitions.
- serveurs de base de données Oracle, Sybase, msql, mysql
- file d'attente de messagerie
- quotas des utilisateurs
- processus particuliers
- processus distants (RPC)
- NIS (les ``yellow pages'' Unix)
- surveillance d'autres serveurs de supervision (surveillance réflexive ou hiérarchique).
- Les équipements
- modem
- frame relay
- imprimantes réseau.
4. Quels types d'alertes ?
- Par message éléctronique via un pager ou un téléphone portable (protocoles SNPP) et TAP.
- Par message vocal via le téléphone, généré par un vocodeur.
- Par courrier électronique.
- Par traps SNMP
5. Quelle sont les solutions choisies ?
MON, un système de supervision conçu et développé par Jim Trocki, un administrateur réseau de la société Transmeta (où travaille Linus Torvalds, le créateur de Linux).
MRTG et RRDTOOL, des systèmes de stockage et de visualisation de données quelconques.
MON, MRTG et RRDTOOL sont des logiciels libres.
6. Qui utilise cette solution ?
- France Télécom Transpac, à Rennes, supervise, 24 heures sur 24 et 365 jours par an, plus de 500 serveurs et équipements réseau. En autres : des routeurs, des stations de travail, des serveurs DNS, LDAP, NNTP, SMTP, FTP, HTTP, Proxy, Lotus Notes, Samba.
- Natexis Banques Populaires supervise, à Paris, des systèmes d'activités de marchés financiers. Plus de 200 serveurs et équipements réseau sont supervisés. Les types de test concernent la connectivité IP, la messagerie Lotus Notes, la plateforme temps réel, les bases de données Sybase, les serveurs NIS etc.