Djeps Submitter Nouveau écrit: «Je utilisées pour atteindre un certain degré de résolution de problème avec les scripts automatisés Nagios Event Handler et RabbitMQ, mais Facebook a fait à une échelle beaucoup plus grande que mes vieux jours de sysadmin Citant:. 'Lorsque votre infrastructure est la taille de Facebook, il ya toujours des serveurs brisées et des morceaux de logiciels qui ont baissé ou sont généralement conduit mal. Dans la plupart des cas, nos systèmes sont conçus de telle sorte que ces questions causent peu ou aucun impact pour les personnes utilisant le site. Mais parfois, des pannes petits peuvent devenir plus pannes, erreurs causant ou mauvaise performance sur le site. Si un morceau de logiciel ou de matériel cassé est l'impact du site, alors il est important que nous le réparer ou le remplacer aussi vite que possible. ... Nous devions trouver un moyen automatisé de traiter ces sortes de questions afin que les ingénieurs humaine pourrait se concentrer sur la résolution et la prévention de la plus grande, les pannes plus complexes. Alors, j'ai commencé à écrire des scripts quand j'ai eu le temps d'automatiser les corrections pour différents types de serveurs brisées et des morceaux de logiciel. "
Lire la suite de cette histoire à Slashdot.
Aucun commentaire:
Enregistrer un commentaire