Engenheiro de Confiabilidade de Sistemas

Ícone
Ícone do Construtor
Ícone
Ícone da área de transferência
Ícone
Ícone de quebra-cabeça
Funções relacionadas: Engenheiro de SRE, Engenheiro de DevOps (SRE), Engenheiro de Confiabilidade de Sistemas, Engenheiro de Operações (SRE), Engenheiro de Infraestrutura (SRE), Engenheiro de Operações de Site, Engenheiro de Produção (SRE), Engenheiro de Plataforma (SRE), Engenheiro de Disponibilidade de Site, Engenheiro de Confiabilidade

Destaques

Títulos semelhantes

Engenheiro de SRE, Engenheiro de DevOps (SRE), Engenheiro de Confiabilidade de Sistemas, Engenheiro de Operações (SRE), Engenheiro de Infraestrutura (SRE), Engenheiro de Operações do Site, Engenheiro de Produção (SRE), Engenheiro de Plataforma (SRE), Engenheiro de Disponibilidade do Site, Engenheiro de Confiabilidade

Descrição do cargo

Antes do surgimento do DevOps, o Google enfrentava um problema e não sabia como resolvê-lo. A empresa administrava sites de grande porte, mas precisava aprimorá-los e ampliá-los ainda mais. Qual foi a solução? O Google designou uma equipe de engenheiros de software para resolver a questão e, a partir de seus esforços, surgiu a base da Engenharia de Confiabilidade de Sites (SRE). Hoje, a gigante do software define a SRE como “o que se obtém quando se trata as operações como se fossem um problema de software”.
 
As práticas de SRE foram tão benéficas que foram adotadas por outras grandes empresas e, com o tempo, aprimoradas e ampliadas, resultando em uma área profissional que compartilha muitas das características do DevOps atual, mas com algumas distinções importantes. Embora ambas existam no meio do desenvolvimento e das operações, a SRE se concentra mais na automação. De fato, o Google certa vez descreveu o objetivo do engenheiro como “automatizar sua saída do emprego”. 
 
Diferentes organizações aplicam o SRE de maneiras diferentes e podem chamá-lo de Engenharia de Produção ou Engenharia de Infraestrutura. Seja qual for o nome, no fim das contas, o trabalho do engenheiro é atuar em equipe, trabalhando continuamente para melhorar a confiabilidade do site, usar KPIs (Indicadores-chave de desempenho) de gerenciamento de incidentes, escrever código, criar serviços e automatizar processos manuais. Como os sites ficam no ar 24 horas por dia, os SREs costumam trabalhar de plantão para responder sempre que forem necessários. 

Atualização sobre o Futuro do Trabalho

 As ferramentas de IA autônoma podem automatizar pipelines de CI/CD e monitorar sistemas em tempo real. Os profissionais de DevOps agora se concentram mais na estratégia de confiabilidade, na resposta a incidentes e na orquestração de fluxos de trabalho impulsionados por IA. A supervisão humana e o pensamento sistêmico continuam sendo essenciais.

Aspectos gratificantes da carreira
  • Trabalhar com uma visão geral dos projetos
  • Atuando como uma ponte essencial entre as equipes 
  • Melhorar os processos e ajudar a aumentar os lucros da organização
  • Remuneração financeira generosa
Os bastidores
Responsabilidades do cargo

Horário de trabalho

A área de SRE oferece uma remuneração atraente, portanto, espere receber esses salários trabalhando em tempo integral! Como explica a ParkMyCloud, a confiabilidade do site equivale, essencialmente, à disponibilidade dos negócios. Em outras palavras, cabe aos engenheiros de confiabilidade do site minimizar o tempo de inatividade, que pode custar caro. Isso pode significar trabalhar fora do horário comercial ou ficar de plantão para responder rapidamente a problemas. 


Funções típicas

  • Criação ou aprimoramento de software relacionado a operações e suporte
  • Otimização e automação de processos
  • Garantir a consistência das práticas de engenharia de lançamento
  • Abordar e minimizar o encaminhamento de casos para níveis superiores de suporte 
  • Registrar e documentar informações recém-adquiridas para consulta futura, por exemplo, através da criação de manuais de procedimentos. Evitar o “isolamento” ou a retenção de conhecimento que poderia ser compartilhado
  • Resolução de problemas
  • Realizar análises de incidentes (também conhecidas como análises pós-incidente, retrospectivas ou análises de causa raiz) para determinar por que um problema ocorreu, sem atribuir culpas 

Responsabilidades adicionais

  • Trabalho em plantão para resolução de problemas e outras questões relacionadas à resposta a incidentes
  • Garantir o cumprimento dos protocolos da organização 
  • Criação de listas de ações para resolver problemas e mitigar questões semelhantes no futuro, no âmbito do Ciclo de Vida do Desenvolvimento de Software
Competências necessárias para o cargo

Competências interpessoais
 

  • Capacidade de facilitar a colaboração entre equipes
  • Resolução analítica de problemas
  • Atenção aos detalhes
  • Atendimento ao cliente 
  • Empatia
  • Flexibilidade
  • Orientado para objetivos
  • Altamente organizado; boa capacidade de gerenciamento do tempo
  • Investigativo e curioso
  • Competências de liderança e gestão
  • Objetividade
  • Orientado para processos
  • Cultura de garantia da qualidade
  • Excelentes habilidades de comunicação

Competências técnicas

Os SREs devem possuir várias competências relacionadas com os seguintes aspectos:

  • Criar ferramentas de automação
  • Linguagens de configuração de compilação
  • Compiladores
  • Bancos de dados
  • Projeto de sistemas distribuídos
  • Conhecimento especializado em administração de sistemas, desenvolvimento, gerenciamento de configuração e testes de integração
  • Gerenciamento geral do código-fonte
  • Instaladores
  • Networking
  • Sistemas operacionais
  • Gerenciadores de pacotes
  • Segurança
  • Engenharia de software
Diferentes tipos de organizações
  • Agências de design de sistemas de informática
  • Empresas
  • Órgãos governamentais/militares
  • Saúde 
  • Instituições de ensino superior
  • Mídia e entretenimento
Expectativas e sacrifícios

Se uma organização possui um ou mais sites tão importantes a ponto de precisarem de um Engenheiro de Confiabilidade de Sites (SRE), as expectativas serão muito altas. De acordo com a Netguru, as quatro principais razões para contratar um SRE são: minimizar o tempo de inatividade, antecipar e mitigar riscos, acelerar o desenvolvimento e economizar dinheiro por meio desses e de outros processos implementados. É claro que os Engenheiros de Confiabilidade de Site têm muito trabalho, e enquanto tentam dar conta da carga de trabalho, também precisam se manter a par das mudanças no mundo da TI. 
 
As jornadas de trabalho podem se prolongar quando ocorrem problemas, sem falar nas escalas de plantão... o que significa que, mesmo quando você está de folga, tecnicamente ainda está de plantão. Os tempos de resposta a incidentes podem ser curtos, e cada empregador tem uma política diferente quando se trata de compensar o trabalho realizado fora do horário comercial. Alguns podem conceder licença remunerada, outros podem oferecer pagamento extra, e outros ainda podem oferecer um sincero “muito obrigado” e nada mais. 

Tendências atuais

A SRE ainda é um conceito relativamente novo para muitas organizações em crescimento. Como resultado, uma tendência é que as empresas ainda estejam tentando descobrir a melhor forma de gerenciá-la. Um dos principais fatores que impulsiona a adoção da Engenharia de Confiabilidade do Site é a resolução de incidentes, o que sugere que as empresas estão simplesmente cansadas de apagar incêndios e querem controlar melhor a situação. 
 
É claro que isso alivia a pressão sobre a gerência, transferindo-a para os profissionais de SRE. Isso, por sua vez, pode exigir que os empregadores encontrem maneiras de manter esses funcionários estressados saudáveis e bem, para que a força de trabalho possa operar com eficiência máxima. Algumas empresas fazem isso melhor do que outras, mas a tendência é reconhecer o valor de cuidar dos funcionários ocupados que estão cuidando dos negócios!

Que tipo de coisas as pessoas que seguem essa carreira gostavam de fazer quando eram jovens...

O nome “Engenheiro de Confiabilidade de Sites” nos dá algumas pistas sobre o tipo de pessoa que trabalha nessa área. Elas gostam de trabalhar com sites, um interesse que a maioria dos SREs desenvolveu na juventude. São responsáveis por garantir que os sites sejam “confiáveis”, o que significa que tudo funcione como deve, quando deve. Assim, os próprios profissionais devem ser confiáveis, o que é outra característica frequentemente aprimorada nos primeiros anos de vida. 
 
Essas pessoas gostam de ser pontuais e preparadas e provavelmente tiveram bom desempenho acadêmico. De fato, para ser engenheiro de qualquer tipo, geralmente são necessárias fortes aptidões acadêmicas, particularmente em matemática e ciências, é claro. Uma das coisas interessantes sobre essa área, porém, é quantas habilidades interpessoais entram em jogo.

Um SRE precisa ser uma pessoa sociável, alguém que se sinta à vontade trabalhando em equipe e capaz de promover a colaboração entre essas equipes. Como resultado, ele pode ter ocupado cargos de liderança na escola ou talvez simplesmente ter tido muitos irmãos com quem lidar! Os SREs são especialistas em eficiência, treinados para encontrar maneiras de melhorar as coisas, estudando problemas e determinando soluções com base em suas pesquisas. Isso requer uma mentalidade criativa, mas analítica, como se os dois hemisférios do cérebro estivessem trabalhando em conjunto. É possível que muitos SREs sejam ambidestros ou tenham habilidade para tocar instrumentos musicais. 

Formação e capacitação necessárias
  • Os engenheiros de confiabilidade de sistemas devem possuir diploma de graduação, de preferência em Ciência da Computação ou área relacionada
  • Não existe um caminho definido para se tornar um SRE. Alguns profissionais começam por meio de um estágio; outros podem fazer um bootcamp e, em seguida, desenvolver suas habilidades enquanto trabalham em outras funções de TI e se aperfeiçoam por conta própria
    • Uma vasta experiência profissional é um requisito fundamental para a maioria dos empregadores (muitos profissionais de SRE começam a carreira em DevOps, como administradores de sistemas, desenvolvedores ou engenheiros de software)
  • Cursos para se familiarizar com Java, Python, Ruby ou C++, bem como com Linux, Kubernetes e MySQL
  • Cursos para desenvolver competências sociais em inglês, redação, conversação, trabalho em equipe e liderança
  • As certificações opcionais incluem:
    • Certificação de Engenheiro de Confiabilidade da Sociedade Americana para a Qualidade
    • Certificação SRE Foundation do DevOps Institute 
    • Certificação Linux+ da CompTIA
  • Aprenda por conta própria fazendo cursos sobre:
    • edX - Introdução ao DevOps e à Engenharia de Confiabilidade de Sistemas
    • Lynda (do LinkedIn) - Fundamentos de DevOps: Engenharia de Confiabilidade de Sistemas
    • Udemy - Uma Introdução à Engenharia de Confiabilidade
    • Coursera - Engenharia de Confiabilidade de Sistemas: Medindo e Gerenciando a Confiabilidade
      • Observe que o mesmo curso também é oferecido na Pluralsight
O que procurar em um programa
  • Muito do que você precisa saber para se tornar um Engenheiro de Confiabilidade de Sistemas de sucesso será aprendido fora do seu curso superior!
  • O ideal é procurar programas que ofereçam cursos nas áreas mencionadas acima
  • Leia as biografias dos professores para saber quais são suas áreas de especialização e trajetória profissional
  • Que tipos de clubes e organizações estudantis existem? Muitas competências sociais e técnicas são aprendidas de forma mais eficaz por meio de interações frequentes com os colegas
  • Certifique-se de que a escola seja credenciada
  • Procure cursos que divulguem estatísticas de emprego após a graduação e tenham um histórico sólido
  • Pese os prós e os contras de se matricular em um curso online. O envolvimento presencial no campus é muito benéfico para o desenvolvimento de competências interpessoais; por isso, às vezes, um curso híbrido pode ser vantajoso
Coisas para fazer no ensino médio e na faculdade
  • Como já foi dito, não existe um caminho único para se tornar um SRE; portanto, avalie algumas opções
  • Dê uma olhada nas vagas anunciadas pelas empresas nas quais você gostaria de trabalhar. Preste atenção às experiências profissionais e acadêmicas exigidas e, a partir daí, trace um plano de carreira para chegar lá
  • No ensino médio, construa uma base sólida cursando o maior número possível de disciplinas eletivas de TI
  • Pratique o máximo possível suas habilidades práticas! Faça cursos relacionados aos itens da seção “Educação e Treinamento” acima
  • Não se esqueça de aprimorar sua escrita. A redação técnica é importante, mas você também precisará explicar temas complexos em linguagem acessível
  • Os SREs precisam de boas habilidades de trabalho em equipe e liderança. Essas são qualidades que muitas vezes são negligenciadas, mas que se espera que você tenha no futuro; portanto, procure maneiras de desenvolvê-las desde cedo
  • Nada supera ter um mentor experiente; por isso, procure ex-alunos ou professores para pedir conselhos 
  • Ensine os outros. Ensinar promove novas experiências de aprendizagem para ambas as partes
  • Leia e participe de discussões no Quora, Reddit, Dev.to e outros sites
  • Quando suas habilidades estiverem no nível adequado, procure uma oportunidade de trabalho remunerado no Upwork
  • Encontre estágios no Indeed ou pergunte ao seu curso se há oportunidades disponíveis
  • Seja um líder em clubes relacionados à área de TI e construa uma ampla rede de colegas e parceiros!
Roteiro típico
Roteiro da Gladeo para a Confiabilidade do Site
Como conseguir seu primeiro emprego
  • Espalhem a notícia! Hoje em dia, a maioria das vagas é encontrada por meio de contatos
  • Faça o teste de seleção da TripleByte DevOps. Se for aprovado, você terá uma entrevista com empregadores da rede da empresa.
  • Procure vagas no Indeed, Monster, USAJobs, ZipRecruiter, LinkedIn e Glassdoor
  • Descubra o que os empregadores procuram! A Usenix disponibiliza um PDF para download com dicas privilegiadas sobre a contratação de SREs
  • Algumas empresas treinam seus SREs internamente; por isso, talvez seja interessante começar em um cargo, mas com o objetivo de progredir na carreira dentro da empresa
  • Faça um estágio. Nem sempre a remuneração é boa, mas você vai conseguir entrar no mercado e isso pode levar a empregos em tempo integral
  • Ainda não há um consenso sobre a utilidade das feiras de emprego, mas as feiras voltadas para setores específicos certamente podem dar uma ideia das oportunidades disponíveis e oferecer a chance de conversar com profissionais da área
  • Deixe seu currículo em dia. O Job Hero tem ótimos modelos de currículo para Engenheiro de Confiabilidade de Sistemas, dos quais você pode tirar ideias
  • Contrate um redator (ou revisor) profissional de currículos para aprimorar seu documento e torná-lo o melhor possível. Mas lembre-se: adapte cada currículo à vaga específica à qual você está se candidatando
  • Explore o vasto banco de dados do GitHub com recursos e perguntas de entrevista!
Como subir na carreira
  • Muito depende do tamanho da organização. Algumas empresas promovem seus próprios funcionários; outras podem preferir candidatos externos. É importante discutir as oportunidades de promoção com seu supervisor desde o início
  • Seja proativo. Capacite-se, faça cursos, continue aprendendo. Quando surgir uma nova tendência tecnológica, procure saber tudo o que puder sobre ela e torne-se um especialista no assunto
  • Demonstre lealdade à sua empresa e torne-se um colaborador de confiança e inestimável, digno de assumir maiores responsabilidades. Comporte-se de forma a mostrar que está pronto para avançar
  • Lembre-se sempre das competências interpessoais. Mesmo o funcionário com maior habilidade técnica terá dificuldade em progredir na carreira se não se der bem com os outros
  • Seja um líder. Demonstre sua competência e seu potencial de liderança. Um SRE deve ser capaz de orientar os outros de maneira colaborativa, mas decisiva (e, quando necessário, firme)
  • Mostre que você é de confiança. Seja pontual e, se estiver de plantão, responda rapidamente ao incidente, execute o trabalho com diligência e encontre maneiras de evitar problemas semelhantes no futuro 
Plano B

A Engenharia de Confiabilidade de Sistemas pode ser uma área profissional empolgante, mas que envolve muita responsabilidade. No entanto, o caminho para ingressar nessa área nem sempre é tão simples assim. Muitas pessoas começam em outras áreas e, às vezes, acabam permanecendo nelas. Algumas opções de emprego como “plano B” incluem:

  • Desenvolvedor de back-end
  • Gerente de Informática e Sistemas de Informação
  • Programador de computadores
  • Especialista em Suporte Informático
  • Analista de Sistemas de Informática
  • Administrador de banco de dados
  • DevOps
  • Desenvolvedor Front-End
  • Desenvolvedor Full-Stack
  • Analista de Segurança da Informação

Feed de notícias

Cursos e ferramentas online