PICARD - Um ano de operação ininterrupta

Prezada comunidade do DEQUI:

Informo que hoje, 17/10/2013, exatamente às 19h13min., o servidor de rede do DEQUI, PICARD, completou 365 dias de operação ininterrupta. Trata-se de um marco inédito na história da rede de informática do Departamento, cuja busca para atingi-lo iniciou-se há quase 16 anos quando assumi a gerência da rede do DEQUI, sob supervisão do professor Argimiro Resende Secchi, atualmente em exercício na COPPE/UFRJ.

A solução adotada pela Gerência de Tecnologia da Informação (GTI) do DEQUI para alcançar essa alta disponibilidade do sistema se encontra baseada nos seguintes pontos básicos: equipamentos robustos, sistema operacional confiável e eficientes técnicas de gerência e monitoração de serviços.

Para diminuir os riscos de prejuízos ao desenvolvimento das atividades dos professores, pesquisadores, alunos e técnicos-administrativos do DEQUI, houve o investimento numa solução completa, tendo como principal objetivo uma infraestrutura que garantisse disponibilidade de praticamente 100%, o que equivale a uma operação ininterrupta de 24 horas por dia, sete dias da semana e 365 dias no ano.

O DEQUI conta com um servidor de rede de alta confiabilidade e tolerante a falhas. Isso significa que o equipamento possui componentes que podem assumir o papel de outro dispositivo com problemas. Essa tolerância a falhas se refere à energia, discos, rede e outros itens de hardware. Simplificando, os componentes de hardware do PICARD possuem redundância. Por exemplo, há duas fontes de alimentação disponíveis. Se uma delas falhar repentinamente, o servidor não sente a falta de energia porque a outra fonte de alimentação está on-line e assume o fornecimento de eletricidade para o equipamento. Além disso, o PICARD faz uso de RAID via hardware e possui duplo sistema de backup. Como sistema operacional, o PICARD utiliza a distribuição DEBIAN LINUX, que é um sistema livre (gratuito e código-fonte aberto), altamente configurável e bem conhecido por sua velocidade e estabilidade, o que o torna o grande foco para servidores de rede.

Os serviços que são executados no servidor, em geral, são a causa mais comum para paradas não planejadas, pois eles não são tolerantes a falhas. Portanto, em relação ao PICARD existe uma busca permanente por uma combinação de sistemas de alta disponibilidade e tolerância a falhas, visando garantir à comunidade do DEQUI a melhor disponibilidade possível.

Naturalmente, sistemas de alta disponibilidade necessitam de constante monitoramento e administração. Apenas depois de planejado, testado e monitorado, é possível fazer o ajuste fino de um sistema altamente disponível. Atualmente, o PICARD opera de forma quase independente. As principais tarefas encontram-se automatizadas. Quaisquer problemas são relatados automaticamente via um sistema de alerta constantemente em operação.

O fato que foi decisivo para a conquista em questão ocorreu em setembro do ano passado, quando, a pedido da GTI, o professor Nilson Romeu Marcilio, via seus recursos financeiros, adquiriu para o DEQUI um nobreak com módulo externo, no valor total de R$ 5.000,00, para ser utilizado junto ao PICARD. A aquisição desse sistema UPS garantiu ao PICARD uma autonomia de energia de 8 horas em caso de interrupção elétrica. Antigamente, por inúmeras vezes, em função do PICARD estar conectado a um sistema UPS de baixa autonomia (2 horas), houve a necessidade de desliga-lo unicamente pelas interrupções de energia elétrica que afetaram o DEQUI.

Aproveito a oportunidade para informar que as boas notícias não terminam por aqui. Via recursos financeiros do REUNI, o DEQUI, conforme sugestão do professor Marcelo Farenzena, adquiriu neste ano um novo servidor de rede da marca DELL ainda mais robusto que o PICARD, no valor total de R$ 16.500,00, com garantia de 5 anos de suporte técnico da própria DELL para atendimento em 365 dias do ano, 7 dias da semana, 24 horas do dia e missão-crítica de até 4 horas para a chegada ao DEQUI de um técnico da DELL. Detalhe interessante: o PICARD, em 2005, foi adquirido por R$ 30.000,00 e o REYNOLDS (atual servidor de backup), por mais R$ 20.000,00, pagos com recursos do projeto do professor Argimiro R. Secchi. Esse novo servidor de rede em conjunto com o PICARD, o REYNOLDS, dois storages do tipo NAS e o switch de borda do DEQUI irão formar uma espécie de “data center”. O espaço disponível para armazenamento de arquivos e dados aumentará significativamente com o novo servidor de rede. Além disso, as tarefas que hoje são todas desempenhadas pelo PICARD serão divididas entre os três servidores. Portanto, na remota possibilidade de haver uma falha de operação em relação a um dos equipamentos, a rede do DEQUI não sofrerá uma parada total. Somente os serviços que estiverem sendo executados a partir do equipamento com problemas sofrerão interrupção, sendo que para o futuro existe um projeto para implementar nos servidores do DEQUI o balanceamento de carga. Todos os serviços serão executados em todos os servidores. Neste caso, se ocorrerem problemas com um dos servidores de rede, o outro servidor assumirá o controle total das funções. Tudo de modo transparente para os usuários, sem que ninguém sequer perceba a falha.

Quero deixar registrado em nome da comunidade do DEQUI os meus sinceros agradecimentos a todos os professores que contribuíram autorizando o emprego de recursos financeiros na área de TI do DEQUI, mais especificamente em relação ao PICARD.

PARABÉNS, PICARD!!! PARABÉNS, DEQUI!!!

IGOR RODACOVSKI
Gerente de TI
DEQUI/UFRGS