Advertisement
Guest User

Untitled

a guest
Jul 29th, 2015
229
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 2.04 KB | None | 0 0
  1. Objet: [adsl] La backbone EU et le routeur gsw-1-a9
  2. Date: 2015-07-29 17:11
  3. De: Octave Klaba <oles@ovh.net>
  4. À: "hosting@ml.ovh.net" <hosting@ml.ovh.net>, "sd-pro@ml.ovh.net" <sd-pro@ml.ovh.net>, "pcc@ml.ovh.net" <pcc@ml.ovh.net>, "<voip@ml.ovh.net>" <voip@ml.ovh.net>, "adsl@ml.ovh.net" <adsl@ml.ovh.net>, "vps@ml.ovh.net" <vps@ml.ovh.net>, "cloud@ml.ovh.net" <cloud@ml.ovh.net>
  5. Répondre à: adsl@ml.ovh.net
  6.  
  7.  
  8. Bonjour,
  9. Nous venons d'avoir un incident sur le routage sur l'un
  10. de 2 routeurs de Paris: gsw-1-a9. L'erreur humaine est
  11. à l'origine de la panne: l'un des ingénieurs de l'équipe
  12. network (c'est mon équipe ..) a effacé par erreur la configuration
  13. OSPF sur le routeur. Malgré la double confirmation de
  14. l'application de la configuration, il a confirmé yes yes ..
  15. des automatismes .. Et donc le routeur gsw-1-a9 est
  16. parti dans les choux.
  17.  
  18. Mais cela tout doit continuer à fonctionner. Sauf que nous
  19. avons eu un bug BGP sur le 3eme routeurs reflector,
  20. rf-3-a1 qui n'a pas communiqué au reste de la backbone
  21. que gsw-1-a9 est down. rf-2-a1 l'a fait et rf-1-a1 a été
  22. down durant la panne. Du coup la backbone continuait
  23. à se comporter comme si le routeur gsw-1-a9 était UP.
  24. On le voyait à travers les loops dans les traceroutes.
  25.  
  26. Nous avons redémarré toutes les sessions BGP sur
  27. rf-3-a1 mais sachant que rf-1-a1 a été en panne avec
  28. gsw-1-a9, et donc que seulement rf-2-a1 assurait la
  29. synchronisation BGP entre tous les routeurs en Europe,
  30. nous avons eu des yoyos dans le réseau en Europe:
  31. ça pouvait pinger ou pas durant 60-120 secondes par
  32. routeur.
  33.  
  34. En suite, tout est revenu puis nous avons remis la configuration
  35. sur le routeur gsw-1-a9. La backbone est UP.
  36.  
  37. Nous sommes sincèrement désolés pour cette panne.
  38. L'erreur humaine peut arriver et la backbone est preuve
  39. pour faire face à ce genre de problèmes. On regarde
  40. pour trouver le bug sur nos RR (ASR1002). Puis on va
  41. déterrer la hache pour s'occuper des doigts de mes
  42. gars ..
  43.  
  44. En savoir plus:
  45. http://travaux.ovh.net/?do=details&id=14176
  46.  
  47. Amicalement
  48. Octave
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement