Services Web indisponibles pendant 8 minutes.
Une interruption du service Web a eu lieu aujourd'hui, entre 18h32 et 18h40, affectant les sites hébergés pendant environ 8 minutes.
Après analyse des journaux, j'ai identifié une fuite mémoire liée au service Web sur le Front-end. De plus, un grand nombre de « signal process » étaient envoyés, ce qui suggère que Nginx et les protections anti-DDoS redémarraient en boucle toutes les 5 minutes.
J’ai identifié le robot fautif de ces redémarrages et j’ai pu corriger son développement, stoppant ces redémarrages intempestifs.
En analysant les journaux sur les « signal process », il s’avère que les services du front étaient redémarrés pratiquement constamment depuis le 23/09, occasionnant, j'imagine, certains ralentissements ainsi que notamment un trop grand nombre de sockets non fermés, origine de la fuite mémoire.
Les services Web sont désormais pleinement opérationnels.