Arbitrum, a maior rede de segunda camada do Ethereum com US$ 2,6 bilhões em valor total bloqueado (TVL), segundo o L2Beat, ficou mais de sete horas fora do ar após a equipe central do projeto ter problemas com seu node sequenciador.
Às 10h da manhã de domingo (9), o Arbitrum alertou seus 160 mil seguidores no Twitter que estava passando por um “período de inatividade do Sequencer”, mas que todos os fundos do sistema estavam seguros. Por volta das 17h, a equipe voltou para informar que o problema estava corrigido.
Mais detalhes vieram logo em seguida, quando a Offchain Labs — startup por trás do projeto criada pelo ex-diretor de tecnologia da Casa Branca, Ed Felten — publicou o post mortem do incidente.
“O problema principal era uma falha de hardware em nosso principal node sequenciador. Embora geralmente tenhamos redundâncias que permitiriam a um sequenciador de backup assumir o controle sem problemas, elas também não entraram em vigor esta manhã devido a uma atualização de software em andamento. Como resultado, o sequenciador parou de processar novas transações”, explicou o projeto.
O problema com o hardware usado para rodar o node e, posteriormente a falha para recuperar o backup, foram um exemplo de como a centralização pode prejudicar uma rede blockchain.
O problema foi assumido pelo Arbitrum que justificou que por ainda estar em fase beta — a sidechain foi lançada em agosto de 2021 —, os nodes sequenciadores ainda são executados pela própria equipe do projeto.
“A boa notícia é que temos um caminho profundamente pesquisado e confiável para descentralizá-lo totalmente”, prometeram.
Como o problema foi resolvido
O Arbitrum é a solução de segunda camada vista como uma das mais promissoras do Ethereum que usa a tecnologia Optimistic Rollup para tornar as transações na rede mais rápidas e baratas.
Por essa razão, a equipe do projeto relembrou no incidente que, mesmo com falhas permanentes no node sequenciador, as transações continuariam sendo processadas pelo Ethereum, só que sem a escalabilidade prometida.
Durante as sete horas que o Arbitrum ficou fora do ar, os desenvolvedores conseguiram restabelecer a rede: “Nos movemos cautelosamente para nos certificar de que todas as transações que foram confirmadas pelo Sequencer antes de ficarem offline foram preservadas e que não haveria reorganização [de blocos]”.
Neste grupo estavam 284 transações que foram aceitas antes da rede cair mas que ainda não haviam passado pela rede principal — o Arbitrum manda lotes de transações a cada poucos minutos ao Ethereum.
“Reiniciamos parcialmente o Sequenciador para primeiro postar essas transações e, somente depois que elas foram confirmadas, restauramos totalmente o Sequenciador para aceitar novas transações”, concluiu o projeto.
No final do incidente, o Arbitrum garantiu que vai acelerar o processo de descentralização para evitar que a equipe central tenha tanto controle sobre a rede.
“Nos próximos dias, semanas e meses, continuaremos neste caminho duplo de minimizar o tempo de inatividade do Sequencer e, ao mesmo tempo, alcançar o objetivo final de descentralização total”.