[Résolu] Indisponibilité des services Web pendant 20 minutes
Suite à une erreur de développement de ma part, l'ensemble des sites Internet ont été indisponibles aujourd'hui pendant 20 minutes entre 13h51 et 14h11 pour les internautes en IPv4, seules les connexions en IPv6 étaient encore disponibles.
Le second problème est que mes contrôles avec alertes sonores/SMS ne m'ont pas alertée du problème à temps.
Le problème est maintenant entièrement résolu : Cette erreur de développement a été corrigée pour que ce problème ne se reproduise pas et j'ai ajouté un contrôle sonore/SMS supplémentaire.
Pour l'explication technique :
J'avais modifié 1 heure avant que le problème se produise, le robot du pare-feux présent en crontab et en l'exécutant manuellement (et donc en dehors du crontab) afin de le vérifier, celui-ci fonctionnait parfaitement.
Sauf qu'au moment où ce robot a été exécuté en tâche cron 1 heure après, une commande présente dans ce robot n'était pas connue dans le PATH global, occasionnant une erreur et l'interruption partielle du robot et du pare-feux.
Le problème est maintenant résolu. Je vous présente mes plus sincères excuses pour la gêne occasionnée.