Easyvista PT blog

Análise de Causa Raiz da ITIL: Revelando o Poder da Resolução de Problemas

Written by EasyVista | Mar 21, 2024 4:20:45 PM

Na gestão de serviços de IT (ITSM), o tempo de inatividade pode traduzir-se em perdas significativas para a empresa, pelo que a resolução rápida da causa raiz dos incidentes é fundamental para o sucesso do seu negócio. A Análise de Causa Raiz (RCA) da ITIL (Biblioteca de Infraestrutura de Tecnologia da Informação) é uma abordagem sistemática projetada para descobrir os problemas subjacentes às interrupções nos serviços de IT. As estruturas, metodologias, princípios e técnicas centram-se na premissa de que é mais eficaz resolver e prevenir sistematicamente problemas (ou seja, impedir que ocorram novamente) em vez de se limitar a apagar cada incêndio. 

Esta publicação do blog aprofunda-se nas complexidades da ITIL RCA, as suas metodologias e a sua importância na manutenção de infraestruturas de IT robustas. 

Compreender a Análise de Causa Raiz da ITIL 

Basicamente, a ITIL RCA é um método estruturado utilizado para determinar as razões fundamentais por detrás dos incidentes e problemas num ambiente de IT. Ao contrário das correções superficiais que abordam apenas os sintomas, a RCA visa prevenir a recorrência de incidentes—melhorando a fiabilidade geral do sistema. 

O núcleo da RCA centra-se em: 

  • Remediar a causa raiz de um problema de IT, em vez de apenas resolver os sintomas para proporcionar alívio a curto prazo 
  • Identificar como é que o problema pode ser evitado no futuro 
  • Colocar o foco no “como” e no “porquê”, e não no “quem” do problema 
  • Encontrar evidências concretas para sustentar quaisquer alegações de causa raiz 
  • Fornecer informações que informem sobre a melhor forma de atuar para resolver o problema 

3 Benefícios da RCA na Gestão de Serviços de IT 

  • Manutenção Preventiva: Ao identificar as causas raiz, as organizações podem implementar medidas preventivas para mitigar futuros incidentes. Esta abordagem proativa minimiza o tempo de inatividade e aumenta a eficiência operacional. 
  • Melhoria Contínua: A RCA promove uma cultura de melhoria contínua nas operações de IT. Através da análise de incidentes passados, as equipas podem implementar ações corretivas e aperfeiçoar processos, levando a uma melhor prestação de serviços e à satisfação do cliente. 
  • Redução de Custos: A resolução de incidentes recorrentes através da RCA reduz a necessidade de suporte reativo e de correções de emergência, reduzindo, em última análise, os custos operacionais e otimizando a utilização de recursos. 

3 Metodologias ITIL RCA 

Existem várias metodologias bem conhecidas utilizadas para conduzir a RCA. Abaixo estão três dos métodos e estruturas mais populares – utilizados em vários setores. Experimente todos eles e veja qual deles se adapta melhor às suas necessidades e preferências. 

Análise de Árvore de Falhas (FTA) 

A Análise de Árvore de Falhas (FTA) é uma abordagem descendente que representa visualmente as potenciais causas de um incidente específico e examina o estado indesejado de um sistema. O sistema foi originalmente desenvolvido por H. Watson e A. Mearns nos laboratórios Bell para a Força Aérea em 1962. Mais tarde foi adotado pela Boeing e agora é utilizado por empresas dos setores aeroespacial, químico e de software para eventos de fiabilidade. Ao decompor sistematicamente os eventos em fatores contribuintes, a FTA ajuda a identificar a causa raiz (o resultado indesejado é considerado a raiz da árvore lógica) e as suas dependências. A árvore de falhas é normalmente escrita utilizando símbolos de portas lógicas. Os símbolos básicos utilizados na FTA são eventos, portas e símbolos de transferência. 

Símbolos de Eventos FTA 

  • Evento básico – falha ou erro num componente ou elemento do sistema 
  • Evento externo – ocorrência prevista 
  • Evento não desenvolvido – um evento para o qual não há informações suficientes disponíveis 
  • Evento de condicionamento – condições que restringem ou afetam portas lógicas 

Símbolos do Porta FTA 

  • Porta OR – a saída ocorre se ocorrer alguma entrada 
  • Porta AND – as entradas são independentes da fonte (a saída ocorre independentemente) 
  • Porta OR Exclusiva – a saída ocorre se ocorrer exatamente uma entrada 
  • Porta AND Prioritária – a saída produzida ocorre apenas se as entradas ocorrerem numa sequência específica, que é especificada por um evento condicionante 
  • Porta de inibição – a saída esperada ocorre se a entrada ocorrer, embora apenas sob uma condição de ativação especificada por um evento condicionante 

Símbolos de Transferência FTA 

Os símbolos de transferência, “Transferência de entrada” e “Transferência de saída” são utilizados para conectar as entradas e saídas das árvores de falhas. 

Técnica dos 5 Porquês 

O método de análise da causa raiz dos 5 porquês baseia-se na ideia de perguntar "porquê" várias vezes para localizar os problemas até às suas origens. A técnica incentiva as equipas de IT a irem além das explicações superficiais e a descobrir questões subjacentes mais profundas. Também ajuda a evitar suposições e a concentrar-se no que ocorreu. 

Como o utilizar: 

1/ Faça uma pergunta sobre “porque é que algo acontece no seu software” ou “porque é que o seu produto faz x em vez de y?” 

2/ Para cada resposta à sua pergunta PORQUÊ, faça outra pergunta mais profunda “Ok, mas PORQUÊ?”. 

DICA: Uma boa forma de pensar sobre isto é imaginar que está a conversar com uma criança curiosa, que é um pouco chata e continua a perguntar: “Porquê?” depois de lhe explicar algo. Se está a ficar irritado com a quantidade de porquês que está a perguntar, está no caminho certo. Quanto mais perguntar “porquê” e descobrir todas as partes complexas da sua infraestrutura de IT, melhor será em encontrar problemas e resolvê-los para melhorar a sua segurança/produto. 

Exemplo 

Pergunta 

Responder 

Porque é que a aplicação está lenta para os utilizadores? 

O servidor que hospeda a aplicação tem uma utilização elevada da CPU. 

OK. Porque é que a utilização da CPU é tão elevada? 

Há um aumento repentino no número de logins de utilizadores simultâneos. 

E porque é que há um aumento no número de logins dos utilizadores? 

Foi lançada uma nova campanha de marketing sem a participação de IT. 

Porque é que a IT não sabia da campanha? 

Falta comunicação entre as equipas. 

Ok, e porque ocorreu a falta comunicação? 

Não existe nenhum processo formal para análise de impacto do projeto. 

Como se pode ver, este é um método informal útil para levar as equipas a aprofundar um pouco mais do que os sintomas iniciais para descobrir o que se passa. No início, fará sentido que os técnicos tentem lidar com a elevada utilização da CPU, mas sem entender porque é que isso está a acontecer, nunca chegaríamos à conclusão de resolver o problema real, que neste caso é a falta de um processo submissão para analisar o impacto dos projetos. 

Diagrama de Ishikawa (Espinha de Peixe) 

O diagrama de Ishikawa, também conhecido como diagrama de causa e efeito, categoriza as potenciais causas de um problema em grupos principais, como pessoas, processos, tecnologia e ambiente. Esta ferramenta visual facilita a análise colaborativa e a resolução holística de problemas. 

Como o utilizar: 

1/ Comece com o problema no centro do diagrama (a espinha do esqueleto do peixe) 

2/ Faça um brainstorming de diversas categorias de causas (colocadas em ramificações a partir da linha principal, as costelas do peixe) 

3/ Agrupe as categorias e divida-as em partes menores (por exemplo, “Pessoas” pode ser um potencial fator de causa raiz de “formação”) 

4/ Aprofunde-se nas possíveis causas e subcausas – questione cada ramo para se aproximar da raiz do problema em questão 

5/ Elimine categorias não relacionadas e identifique fatores correlacionados (ou seja, causas raíz) 

Categorias Comuns a Incluir: 

  • Máquina (equipamento, tecnologia) 
  • Poder do homem/mente (trabalho físico ou de conhecimento) 
  • Missão (propósito, expetativa) 
  • Gestão / poder financeiro (liderança) 
  • Produto (ou serviço) 
  • Preço 
  • Processo (sistemas) 
  • Pessoas 

Como Implementar Práticas Eficazes de RCA 

Com práticas eficazes de RCA implementadas na gestão de serviços de IT, será capaz de diagnosticar e resolver quaisquer problemas relacionados com IT de forma proativa, economizando potencialmente centenas de milhares ou até milhões de dólares à sua organização. As três etapas abaixo descrevem a visão geral das melhores práticas recomendadas para implementar com sucesso a RCA na sua organização. 

  • Estabeleça Procedimentos Claros: Defina os procedimentos padronizados de toda a empresa para conduzir análises de causa raiz de IT. Certifique-se de definir funções e responsabilidades dentro da equipa de RCA e de definir critérios claros para priorizar incidentes com base no seu impacto e frequência. 
  • Incentive a Colaboração: Promova a comunicação aberta e a partilha de conhecimento entre as equipas de RCA para obter diversas perspetivas e conhecimentos. 
  • Descobertas de Resultados: Documente os resultados da análise da causa raiz numa base de conhecimentos centralizada— incluindo causas raiz identificadas e ações recomendadas. Este repositório servirá como um recurso valioso para referência futura e facilitará a aprendizagem organizacional. 

A Análise de Causa Raiz da ITIL é a base da gestão eficaz de serviços de IT, permitindo que as organizações diagnostiquem e resolvam problemas subjacentes de forma proativa. Ao adotar metodologias estruturadas de RCA e ao promover uma cultura de melhoria contínua, as empresas podem aumentar a resiliência operacional, reduzir custos e fornecer serviços superiores aos seus clientes. Adotar a RCA não se trata apenas de resolver incidentes; trata-se de cultivar uma mentalidade de solução de problemas e inovação que impulsiona o sucesso a longo prazo no cenário em constante evolução das operações de IT. 

O nosso lançamento do produto 2024.1 inclui análise de causa raiz, acessibilidade digital, descoberta automatizada de ativos de IT e atualizações melhoradas de recursos de AI. O roteiro de Mapeamento de Descobertas e Serviços (DDM) da EV Discovery ajudará os clientes a obter uma visão de 360 graus do seu cenário de IT; automatizar a gestão de ativos e configurações; rastrear alterações e manter trilhas de auditoria; e integrar-se perfeitamente com os produtos ITSM da EasyVista – espera-se que recursos adicionais de mapeamento de dependências sejam lançados ainda em 2024.