Par florentM,
dimanche 26 mars 2006 à 23:43
:: Net
Bon alors on va encore me dire mais qui est Redbus ?
Rien de plus facile, c'est le plus gros datacenter de France, l'hébergeur des hébergeurs, chez eux sont stockés entre autres les serveurs de SIVIT, OXYD, AMEN ... et quelques baies OVH ( j'ai de la chance je ne suis pas hébergé dessus pour mon 60GP de chez OVH ). En gros une grosse partie des sites web français sont indirectement ( par le biais de leurs hébergeurs respectifs ) hébergés dans les locaux de Redbus
Revenons-en aux faits. Le 28 février dernier il y avait eu 2 coupures dans la même après-midi, j'avais remarqué ceci par le fait que plusieurs sites étaient innaccessibles mais sans y faire trop attention.
Le lendemain matin en faisant mon petit tour sur je m'étais informé sur le pourquoi du comment et ça faisait déja du bruit car il y avait eu de la casse du côté de certains disques durs.
Ce dimanche 26 Mars soit moins d'un mois plus tard, ne voilà -t-il pas qu'aux alentours des 11h après avoir fait une gentille grasse matinée je vais faire mon petit tour sur le net et plusieurs sites que je suis étaient HS. Là je me dis non tu vas pas me dire qu'ils ont remis ça. Je contacte un ami qui est lui chez SIVIT et il me confirme avoir reçu un mail de leur part pour les informer ce qui a confirmé mes doutes. Redbus a remis ça ( non non ce n'est pas la pub danette ). Je me dis bah ils ont eu une panne il y a peu, il en est ressorti une expérience et la remise en route sera rapide. Je ne vais pas épiloguer sur la suite; il y aura donc eu 3 coupures dans la journée. Un mini résumé qu'OVH ( qui a aussi son propre datacenter ) nous a gentiment proposé pendant les "évènements" :
Sunday, 26 Mar 2006, 11:56am
10:55:20 debut de la panne electrique
11:54:41 fin de la panne, debut de remonté electrique
Sunday, 26 Mar 2006, 3:20pm
14:32:10 en encore une coupure !!!
15:16:28 Ã nouveau up !!!!!
Sunday, 26 Mar 2006, 5:07pm
17:01:02 3ème coupure electrique
17:05:28 fin de la coupure.
La version de chez SIVIT :
1er incident électrique Redbus:
10h45->12h00 .
2e incident électrique Redbus:
14h30->16h30:
3e incident électrique Redbus:
17h00->18h10
On peux remarquer que les durées pendant lesquelles les coupures ont été effectives coupures ne sont pas négligeables, il faut aussi penser qu'il faut redémarrer tous les serveurs à la main; c'est surtout ça qui prends du temps ce qui explique les différence de temps exposé par les deux hébergeurs .
De plus on ne peux qu'immaginer la perte de CA des sites étant hébergés dans leurs locaux, une sacrée perte.
Le problème ? 
En gros il y a eu des micro-coupures de courant ( ce à quoi Redbus est normalement protégé par ces dispositifs ) mais il y a eu des problèmes avec les onduleurs qui effectuent la transition entre le moment où la coupure a lieu et le lancement des générateurs ce qui a déclencé la coupure nette. Il y a eu aussi le disjoncteur principal qui a laché au bout de la 3ème coupure.
Je ne vais pas m'engoufrer dans les détails pour ne pas dire de bétises.
Ce Lundi 27 , alors que depuis la veille tout tournait sur les générateurs ( ça a consommé pas mal de fuel; quand ils ont les reservoirs pleins ils stokent 50 000 litres de fuel quand même !! ) le disjoncteur a été réparé ce soir à 20h puis tout a été coupé afin de réinsérer les onduleurs sur le cirquit electrique afin de les recharger. Normalement, mardi soir à 20h Redbus rebasculera tout le batiment sur le réseau électrique d'EDF. Leur infrastructure est encore pour l'instant fournie en électricité par les générateurs.
Finalement le basculement a été fait mercredi à 4h du matin afin de finir le chargement des batteries
Bon pour enfoncer un peu le clou j'ai remarqué lors des 4 coupures que leur site n'a jamais été coupé .
Allez pour le fun voila ce que l'on peut trouver un jour après la panne :

Pour finir on a tous une pensée pour les techniciens et autres employés des hébergeurs ( Hors Redbus ) étant d'astreintes Dimanche et ces deux soirs qui ont dû faire plusieurs allez-retours afin de réallumer les serveurs de leurs clients, ainsi qu'a tous les employés de Redbus qui ont du passer un week-end et un début de semaine peu commun.
Avec ces deux pannes à moins d'un mois d'intervalle la réputation autrefois infaillible de Redbus en a pris un coup.
Eux qui étaient si fier de leur 100% de garantie de fonctionnement l'ont déja enlevé de leur page sur leur site officiel.
Sources : OVH, Pcinpact ainsi que les mails reçus par JVgamers d'Héberg-Forum de la part de SIVIT