Prezado cliente,

 

Este documento tem o objetivo de explicar o incidente ocorrido neste sábado (07/07) que causou a indisponibilidade das lojas Tray Corporativo.

 

Descrição do Incidente.

 

Às 15:27 nosso sistema de monitoramento notificou nossa engenharia com o problema em um dos nossos firewalls, firewall este que atende o grupos de servidores da plataforma Tray Corp. Imediatamente criamos as ações para corrigir o problema com as seguintes atividades:

 

1 - Contato com a empresa que faz a gestão dos firewalls. O equipamento apresentava falha geral impossibilitando o acesso para gestão ou manutenção;

 

2 - Acionamos nosso time para analisar localmente o problema e corrigi-lo. Após reiniciamos o firewall localmente, o acesso a ele normalizou mas ainda não estava funcionando como deveria.

 

3 - Após efetuar algumas configurações, o equipamento de firewall ainda apresentava problemas em seu funcionamento.

 

4 - Com este resultado negativo, imediatamente trocamos o firewall danificado para outro já instalado em nossa infraestrutura.

 

5 - Após a troca e reconfiguração das regras, o acesso foi normalizado às 17:03.

 

Como descrito acima, uma falha no firewall causou uma indisponibilidade de 1 hora e 36 minutos no ambiente de lojas Tray Corporativo.

 

A Tray investiu em uma nova solução de segurança de última geração que trará uma maior disponibilidade para todos os sistemas oferecidos a seus clientes. Estes novos firewalls devem entrar em operação em breve.

 

Portanto já iniciamos ações de melhorias a partir deste problema.

 

  • [CONCLUÍDO] Troca do equipamento danificado;

 

  • [CONCLUÍDO] Aquisição de nova solução de firewall de última geração e tolerante a falhas.

 

  • [EM ANDAMENTO] Troca dos firewalls antigos para os novos. Vamos priorizar isso com a empresa contratada. Estamos trabalhando neste planejamento para não impactar o ambiente atual.

 

  • [MELHORIA CONTÍNUA] Rever e melhorar o plano de recuperação de incidentes. Mesmo com uma estrutura redundante, os firewalls atuais não oferecia este recurso. Não podemos e nem devemos mais ter tal estrutura.

 

Nunca é demais dizer o quanto sentimos por termos falhado. Vamos aprender com este incidente e trabalhar arduamente para oferecer alto padrão de qualidade pelo qual prezamos tanto.

 

Equipe de Infraestrutura

Fernando Zambrano 
Tem mais dúvidas? Envie uma solicitação

Comentários

    Artigos nessa seção