Degradação de desempenho no cache da plataforma LMS

Incident Report for Cademi

Postmortem

Sobre o ocorrido:
A instabilidade identificada foi causada por uma falha de rede no cluster responsável pelos serviços de cache da plataforma LMS. Esse problema impactou o roteamento interno entre os nós do cluster, resultando em lentidão e falhas ocasionais no carregamento de conteúdos.
É importante destacar que o serviço de recebimento de compras e criação de acessos não foi afetado pela instabilidade.

Fato Relevante:
O incidente ficou restrito ao cluster de cache da Cademí, mas teve reflexos na experiência de parte dos usuários. O isolamento rápido do problema e o remapeamento de endereços de rede foram decisivos para reduzir a extensão do impacto.

Ações tomadas:

  • Às 8h59 foi iniciado um processo de remapeamento de rede para corrigir a falha.
  • Às 9h10 o remapeamento foi concluído e a equipe passou a monitorar o comportamento do cluster.
  • Às 10h30 a estabilidade foi confirmada e o incidente dado como resolvido.

Dados e informações:
Nenhuma informação ou dado relevante dos projetos foi afetado ou perdido durante o período de instabilidade.

Transações:
Todas as transações de compras realizadas durante o incidente foram processadas normalmente, sem impacto na criação de acessos de novos alunos.

Agradecemos pela compreensão e reforçamos que seguimos investindo em melhorias contínuas de resiliência e monitoramento preventivo em nossa infraestrutura.

Nossa equipe permanece à disposição em todos os canais de suporte para eventuais esclarecimentos.

Reiteramos nosso compromisso com a segurança, transparência e confiabilidade dos serviços.

Atenciosamente,
Equipe de Suporte Cademí

Posted Sep 23, 2025 - 10:42 GMT-03:00

Resolved

A instabilidade foi totalmente solucionada. O cluster de cache está operando normalmente e seguimos monitorando para garantir a continuidade do serviço.
Posted Sep 23, 2025 - 10:39 GMT-03:00

Monitoring

O remapeamento foi concluído. No momento estamos monitorando a estabilidade do cluster para garantir a normalização do serviço.
Posted Sep 23, 2025 - 09:10 GMT-03:00

Update

Confirmamos que a instabilidade está relacionada a problemas nos endereços de rede do cluster de cache. Iniciamos um processo de remapeamento de rede para corrigir a falha.
Posted Sep 23, 2025 - 08:39 GMT-03:00

Investigating

Estamos investigando uma instabilidade nos serviços de cache da plataforma LMS, que pode impactar a experiência de parte dos usuários.

O serviço de recebimento de compras e criação de acessos não foi afetado pela instabilidade. Nossa equipe técnica já está analisando a causa.
Posted Sep 23, 2025 - 08:09 GMT-03:00
This incident affected: Cademí, Área do Aluno, and Área do Administrador.