Diagnostic continu d'une base de données, évitez l'incident!
La base de donnée est l'un des composants les plus critiques, et les incidents coûtent cher, très cher.
Le monitoring classique permet de réagir vite face aux problèmes, mais il intervient après coup. Et si on pouvait anticiper?
Trop souvent, des signes avant-coureurs sont ignorés: requêtes bloquantes, locks trop longs, dead rows qui s'accumulent, statistiques obsolètes ou changements soudains de volumétrie... Ces indices, négligés, auraient pu prévenir l'incident, une longue investigation et épargner un post-mortem pénible 😅
Après des échanges approfondis avec des DBAs, SREs et développeurs d'entreprises parmi les plus exigeantes, je vous propose un bilan des sources de problème les plus courants, et surtout des solutions concrètes pour détecter ces signaux à temps et intervenir avant qu'il ne soit trop tard.