Gartner Report

Market Guide 2023 de Gartner® para Plataformas de Gestión de Servicios TI

Blog

Consulta el blog de EasyVista para estar al día de las últimas noticias, tendencias y mejores prácticas en transformación digital. Deja que EasyVista te mantenga al día y a la vanguardia de un sector en constante cambio.

Centro de Recursos

Nos comprometemos a poner a tu disposición recursos que te ayuden en tus metas de software ITSM.

Seminarios Web y Eventos

Manténgase actualizado sobre nuestros últimos seminarios web y eventos de ITSM, ITOM o ESM ahora

Lo último en EV

Manténgase actualizado sobre las últimas noticias y eventos de EasyVista.

EasyVista | 26 marzo 2024

Reduce los falsos positivos de ITSM con estos dos marcos estadísticos

AIOps marca el comienzo de un futuro brillante para las operaciones de gestión de servicios de TI (ITSM). Saca partido delas técnicas de inteligencia artificial (IA) y aprendizaje automático (ML) para automatizar y mejorar diversos aspectos de la prestación y gestión de servicios de TI. Las plataformas AIOps tienen mucho potencial porque supervisan continuamente las métricas de rendimiento de las bases de datos, como son: el tiempo de respuesta, el rendimiento y el uso de los recursos, señalando automáticamente las desviaciones del funcionamiento habitual. Es innovador. 

Al emplear estos algoritmos de aprendizaje automático, las plataformas también pueden identificar patrones de rendimiento y recomendar optimizaciones de forma anticipada para mejorar la eficiencia de la base de datos. En concreto, los datos históricos de rendimiento y los análisis predictivos a los que pueden acceder los AIOps ayudarán a tu empresa a pronosticar posibles fallos de la base de datos o la caída del rendimiento para minimizar el tiempo de inactividad y garantizar el acceso ininterrumpido a los datos críticos. 

Lograr esto, de forma ininterrumpida y dar respuesta a las notificaciones correctas, supone, reducir, por fin, la cantidad de falsos positivos que genera tu sistema ITSM. Esta publicación de blog tratará sobre qué son los falsos positivos en ITSM, sus consecuencias y qué dos marcos estadísticos puedes implementar dentro de tus plataformas para reducir la probabilidad de que ocurran falsos positivos. 

Consecuencias y causas de los falsos positivos en ITSM 

Los falsos positivos en la Gestión de Servicios de TI (ITSM) se refieren a casos en los que se genera una alerta o notificación para indicar un problema dentro de la infraestructura de TI. Y, una vez investigado, se determina que no existe ningún problema real o que el problema no es lo suficientemente importante como para prestarle atención. Además de ser ruidosos y molestos, estos falsos positivos tienen muchas consecuencias y causas adversas en ITSM: 

  • Umbrales de monitorización mal configurados: los umbrales de monitorización configurados incorrectamente pueden generar falsos positivos. Por ejemplo, si los umbrales para una métrica de rendimiento como el uso de CPU se establecen de manera excesiva (incluso las variaciones normales en el comportamiento del sistema pueden activar alertas), puede haber falsos positivos. 
  • Problemas transitorios: los picos de tráfico de la red o las fluctuaciones temporales en el rendimiento del sistema pueden provocar falsos positivos si los sistemas de monitorización de TI interpretan los picos como señal de problemas mayores. A veces, estos problemas transitorios se resuelven por sí solos, pero otras veces necesitaran la asistencia directa de los equipos de TI. 
  • Limitaciones de las herramientas de monitorización: algunas herramientas de monitorización de TI carecen de la capacidad de distinguir entre fluctuaciones normales en el rendimiento del sistema y problemas genuinos, lo que puede resultar en falsos positivos. 
  • Fallos de dependencia: Pueden ocurrir falsos positivos debido a dependencias entre diferentes componentes de la infraestructura de TI que carecen de la correlación adecuada y del análisis de causa de origen . Por ejemplo, un fallo en un sistema puede activar alertas para sistemas de abajo que en realidad no están experimentando problemas. 
  • Fatiga de alarmas: cuando las alertas no reflejan constantemente problemas reales o requieren una acción constante, el personal de TI puede volverse insensible a las alertas (también conocido como fatiga de alarmas), lo que puede llevar a una menor capacidad de respuesta y a pasar por alto problemas serios de TI. 
  • Información contextual deficiente: sin suficiente contexto sobre el entorno de TI más amplio, el impacto empresarial o los datos históricos de rendimiento, los equipos de TI pueden tener dificultades para distinguir entre problemas genuinos y anomalías transitorias, lo que genera más falsos positivos. 
  • Errores manuales: pueden ocurrir falsos positivos debido a errores manuales (error humano al configurar las herramientas de monitorización) o a la mala interpretación de los datos de monitorización por parte del personal de TI. 

8 prácticas recomendadas para la fijación de umbral de falsos positivos en ITSM 

En el contexto de los falsos positivos para ITSM, las fijaciones de umbral son límites predeterminados que se utilizan para medir el rendimiento de una métrica o valor. Estas recomendaciones pueden variar en función del contexto específico, las herramientas utilizadas y los requisitos organizacionales. Sin embargo, a continuación, te indicamos algunas recomendaciones generales que, cuando se adoptan, pueden reducir efectivamente los falsos positivos en las notificaciones de alerta de tu plataforma ITSM y mejorar la eficiencia operativa de tu negocio. 

  • Línea base de lo que es normal: define una línea base del comportamiento normal del sistema antes de establecer un umbral (necesitas saber desde qué punto partes). Por ejemplo, si una red normalmente experimenta mayores volúmenes de tráfico entre semana de 9 de la mañana a 5 de la tarde., este patrón debe incorporarse a la línea base, permitiendo una diferenciación más precisa entre picos normales y problemas potenciales fuera de estas horas pico. La línea de base será concreta para tu entorno empresarial y debes considerar patrones de uso típicos, métricas de rendimiento y cualquier fluctuación conocida: cualquier cosa que se considere "normal" y se utilice para medir el rendimiento del producto. 
  • Ajustar alertas y umbrales: configura los umbrales para las métricas de rendimiento (por ejemplo, las tasas de error) a partir de datos históricos y patrones observados. Asegúrate de revisar y reajustar periódicamente estos umbrales a lo largo del tiempo. SUGERENCIA: Puede resultar útil establecer un recordatorio en tu calendario o herramienta de gestión de proyectos cada trimestre para hacer esto. 
  • Aprovechar el análisis estadístico: establece umbrales dinámicamente en función de datos históricos, utilizando la desviación estándar o el análisis de puntuación Z. Estos umbrales dinámicos se ajustarán a las fluctuaciones de las métricas de rendimiento, en lugar de permanecer inmóviles (es decir, fijos), lo que reducirá los falsos positivos causados por picos o fluctuaciones temporales. 
  • Contextualizar las alertas: incorpora información contextual (por ejemplo, para qué parte del negocio es relevante o quién es el responsable de la tarea) en las reglas de alertas de ITSM para priorizar las alertas del sistema en función de su impacto potencial en servicios críticos o procesos comerciales. 
  • Análisis de correlación y causa de origen: implementa un análisis de correlación y causa de origen para identificar problemas subyacentes y reducir el ruido de las alertas asociadas; esto aborda la causa de origen, no solo los síntomas del problema. 
  • Mecanismos de retroalimentación: anima al personal de TI a brindar retroalimentación sobre la precisión y relevancia de las alertas. Luego utiliza sus comentarios para perfeccionar las reglas de alerta, los umbrales y la lógica de correlación en el tiempo. 
  • Corrección automatizada: implementa reparaciones automatizadas para problemas de TI conocidos y/o tareas de mantenimiento de rutina. Esto reduce la necesidad de intervención manual y minimiza los falsos positivos causados por problemas transitorios. La implementación de reparaciones automatizadas se puede lograr definiendo flujos de trabajo claros y revisándolos periódicamente para garantizar que permanezcan alineados con los objetivos de tu organización. 
  • Colaboración e intercambio de información: fomenta la colaboración multifuncional entre todos los equipos dentro de tu organización (por ejemplo, equipo de operaciones y desarrollo) para fomentar la colaboración y el intercambio de información entre todo el personal de TI. 

Varias de estas prácticas están respaldadas directamente por las plataformas AIOps. Consulta con tus equipos de servicios profesionales o busca material de formación sobre cómo implementar estos umbrales y prácticas. 

Dicho esto, queremos profundizar un poco más en la desviación estándar y el análisis de puntuación Z, así que echemos un vistazo. 

Los impactos de la desviación estándar y el análisis de puntuación Z en los falsos positivos de ITSM 

Para reducir aún más las posibilidades de recibir falsos positivos en las notificaciones ITSM, se puede utilizar el análisis de desviación estándar y puntuación Z para proporcionar un marco estadístico para comprender y detectar anomalías en los datos dentro de tu plataforma AIOps. Te indicamos cómo: 

Desviación Estándar 

La desviación estándar es una medida de la variabilidad de un conjunto de datos. Una desviación estándar ayuda a cuantificar en qué medida los puntos de datos individuales se desvían de la media. En el caso de las plataformas AIOps, a menudo se utiliza para establecer umbrales de comportamiento normal basados en datos históricos del sistema (por ejemplo, tiempos de respuesta o tráfico de red) y determinar qué desviaciones, de las que quedan fuera del rango esperado, pueden indicar una anomalía o un problema potencial y requieren atención. Una vez que se establecen los umbrales, las plataformas AIOps pueden aprovechar estos conocimientos obtenidos de las métricas de desviación estándar para activar alertas e iniciar acciones de reparación automatizadas. 

Análisis de puntuación Z 

El análisis de puntuación Z es un método para evaluar cuántas desviaciones estándar tiene un punto de datos y la media de los otros valores. El análisis cuantifica la distancia entre un punto de datos individual y la media (en términos de desviaciones estándar). 

Se utiliza un análisis de puntuación Z para mejorar la granularidad de la detección de anomalías al proporcionar una medida más precisa de la importancia estadística de las desviaciones para las plataformas AIOps. Una puntuación Z alta indica que un punto de datos está lejos de la media, lo que sugiere una anomalía significativa. Utilizando un análisis de puntuación Z para tu plataforma AIOps, puedes priorizar las alertas de TI y centrar tu atención en las anomalías más críticas presentadas, lo que te permite diferenciar mejor entre fluctuaciones menores y problemas críticos que requieren soporte inmediato. También facilita un análisis comparativo entre diferentes conjuntos de datos y períodos de tiempo, lo que permite que tu sistema AIOps identifique patrones y valores atípicos que son problemas emergentes. 

La desviación estándar y el análisis de puntuación Z no lo son todo cuando se trata de detección de anomalías para plataformas AIOps. Son herramientas. Mejoran la eficacia de las predicciones de AIOps al proporcionar medidas estadísticas para cuantificar e identificar anomalías en los datos dentro de tu sistema. Dicho esto, pueden ayudar significativamente. Al incorporar estas técnicas en algoritmos de detección de falsos positivos, las plataformas AIOps pueden mejorar la precisión de las predicciones, ayudando a tu equipo de TI a gestionar de forma más dinámica tu infraestructura de TI. 

¡No más falsos positivos! 

A medida que avanzamos por los entresijos de la reducción de falsos positivos dentro de ITSM, queda más claro que combinar el rigor estadístico con las plataformas AIOps no solo es inteligente, sino que es esencial. Desde establecer una base sólida de "normalidad" hasta ajustar nuestro enfoque con análisis de desviación estándar y puntuación Z, hemos trazado una hoja de ruta para sistemas de alerta más claros y fiables. 

Recuerda, en el ecosistema digital, los falsos positivos son más que simples molestias menores; son obstáculos para la eficiencia y la claridad. Al aplicar estos marcos y aprovechar el poder de AIOps, podemos transformar estos obstáculos en oportunidades para mejorar la precisión operativa y la armonía de TI. Por lo tanto, reduzcamos las falsas alarmas y avancemos hacia un futuro en el que cada alerta sea tan significativa como procesable, haciendo que nuestras operaciones de TI no solo cumplan con los términos de moda. 

EasyVista

EasyVista is a global software provider of intelligent solutions for enterprise service management, remote support, and self-healing technologies. Leveraging the power of ITSM, Self-Help, AI, background systems management, and IT process automation, EasyVista makes it easy for companies to embrace a customer-focused, proactive, and predictive approach to their service and support delivery. Today, EasyVista helps over 3,000+ enterprises around the world to accelerate digital transformation, empowering leaders to improve employee productivity, reduce operating costs, and increase employee and customer satisfaction across financial services, healthcare, education, manufacturing, and other industries.