Gmail, spiegate le cause del downtime

Sep 3, 2009 | Category: Gmail

Tutto il mondo attendeva una spiegazione dopo il downtime di Gmail di due giorni fa, oltre 100 minuti ininterrotti offline e visibilità sporadica nel corso della giornata, tanto è bastato per popolare social network e testate di tutto il mondo, con la notizia “clamorosa” di un downtime prolungato per uno dei più famosi servizi email al mondo.

Cosa è successo lo spiega il VP of engineering di Google, Ben Treynor: come per le scorse “puntate”, anche per questo downtime sembra che una serie di coincidenze e di errori abbiano portato offline il servizio; Google oltre ad utilizzare i server che si occupa dell’invio e della gestione della posta, utilizza ovviamente alcuni routers con il compito di redirigere le richieste sulla sua struttura, lavorando in base a diversi parametri, tra cui il carico è un fattore decisivo per portare una richiesta su un nodo piuttosto che su di un altro. A causa di una manutenzione programmata alcuni mail server erano offline, alcuni routers incaricati di “girare” le richieste si sono sovraccaricati, hanno creato una lunga coda di richieste che ha intasato anche gli altri routers, e di fatto hanno bloccato “il traffico” di richieste verso i server mail.

Cosa significa? Il problema era in “superficie”, i mail server di Gmail funzionavano senza problemi, in ricezione così come in invio, ma le richieste dal web non giungevano sui server di Gmail a causa dell’overload sui request routers. Spiegato con ciò anche il motivo per cui IMAP e POP fossero perfettamente funzionanti, e non fosse invece online la interfaccia di Gmail. Il post spiega che verranno presi provvedimenti dopo quanto accaduto, pur avendo una struttura super ridondanta per quanto riguarda il servizio email, i routers incriminati non godono di sufficiente ridondanza, e un problema simile è bastato per bloccare l’intero accesso al servizio.

From: http://www.hostingtalk.it

Bookmark and Share

Comments are closed.