Rapporto Gartner

Market Guide 2023 di Gartner® per le Piattaforme di Gestione dei Servizi IT 

Blog

Consulta il blog di EasyVista per essere sempre aggiornato sulle ultime novità, tendenze e best practice della trasformazione digitale. Lascia che EasyVista ti tenga aggiornato e all'avanguardia in un settore in continua evoluzione.

Centro Risorse

Ci impegniamo a fornire risorse che ti aiutino a soddisfare tutte le tue esigenze di software ITSM.

Webinars ed Eventi

Rimani aggiornato sui nostri ultimi webinar ed eventi ITSM, ITOM o ESM ora.

Le ultime su EV

Rimani aggiornato sulle ultime novità ed eventi per EasyVista.

EasyVista | 19 settembre 2024

Il costo per le aziende delle interruzioni IT

I sistemi IT costituiscono la spina dorsale di quasi tutte le operazioni aziendali. Dalla gestione dei dati alla facilitazione delle interazioni con i clienti, le aziende dipendono fortemente dalla propria infrastruttura IT. 

I recenti incidenti che hanno coinvolto imprese multinazionali hanno messo in evidenza il profondo impatto che le interruzioni IT possono avere sulla continuità operativa, sulla reputazione e sulla stabilità finanziaria di un organizzazione.

Nel caso della vicenda che ha interessato l’azienda statunitense di cybersecurity CrowdStrike, abbiamo assistito alla comparsa sugli schermi dei device di tutto il mondo della BSOD, la Blue Screen of Death di Windows.

Ad aggravare una situazione già caotica, l’interruzione ha colpito i servizi cloud Azure di Microsoft provocando un’ulteriore serie di guasti. 

Importanza e limiti dell’IT nelle moderne operazioni aziendali

L’episodio che ha coinvolto CrowdStrike e Windows testimonia una volta di più l’enorme peso assunto dalle tecnologie digitali nella conduzione quotidiana di funzioni aziendali critiche, come transazioni finanziarie, gestione delle relazioni con i clienti (CRM), gestione della supply chain e molto altro ancora. 

I sistemi IT supportano una vastissima serie di processi, dalla comunicazione e collaborazione all’archiviazione ed elaborazione dei dati. La loro efficienza, velocità e affidabilità influenzano direttamente la capacità di un'azienda di competere sul mercato.

Man mano che le aziende avanzano nel loro percorso di trasformazione digitale, la loro dipendenza dai sistemi IT cresce in modo esponenziale. La correlazione sempre più stretta tra digitalizzazione e dipendenza dalla tecnologia ha introdotto nuove efficienze, ma ha anche reso le aziende più vulnerabili agli IT outage. 

Quando si verifica, un’interruzione può arrivare a interessare tutti gli aspetti dell'azienda, dalle operazioni interne ai servizi rivolti al cliente.

 

 

Comprendere le interruzioni IT: cause e conseguenze

Negli ultimi mesi, diversi incidenti di alto profilo hanno messo in evidenza la gravità di una interruzione IT. L’IT outage che ha coinvolto CrowdStrike e ha avuto un impatto anche sugli utenti Windows, ha comportato la moltiplicazione degli errori BSOD, causando drammatiche conseguenze per le aziende che si affidano a queste piattaforme. 

L’incidente ha evidenziato vulnerabilità sia nei software sia nei sistemi di sicurezza.

In generale, le interruzioni IT possono verificarsi per diversi motivi: guasti tecnici, errori umani e fattori esterni. Le aziende devono comprendere queste cause per poter sviluppare strategie efficaci grazie alle quali prevenire le interruzioni e minimizzarne l’impatto. 

Di seguito, abbiamo provato a esplorare le cause principali delle interruzioni IT e le loro implicazioni per le operazioni aziendali.

Guasti tecnici

I guasti tecnici sono tra le cause più comuni delle interruzioni IT. Possono derivare da malfunzionamenti hardware, come guasti del server o interruzioni di rete oppure bug o glitch del software responsabili dell’arresto anomalo dei sistemi. 

  • Malfunzionamenti hardware. I componenti hardware, sebbene progettati per rimanere stabili in situazioni estreme, possono guastarsi per effetto dell'usura o di problemi imprevisti. Possono portare a interruzioni immediate e gravi, in particolare se i sistemi critici non dispongono di ridondanza o soluzioni di backup.
  • Bug e glitch del software. Il software è un'altra fonte comune di interruzioni IT. Bug, aggiornamenti incompatibili o patch eseguite male possono rendere i sistemi inaffidabili. Gli errori BSOD testimoniano visivamente il verificarsi di questo ordine di problemi correlati al software.

Gli IT outage sono spesso dovuti a incompatibilità o errori del software che possono portare anche a interruzioni molto estese.

Errore umano

Configurazioni scorrette, manutenzione di routine difettosa o mancanza di formazione adeguata: l’errore umano, soprattutto se interessa sistemi critici, può determinare o contribuire al presentarsi di interruzioni IT, causando lunghi tempi di inattività.

  • Configurazioni errate ed errori. Semplici errori, come configurazioni di rete errate o impostazioni di applicazione non idonee, possono avere conseguenze di vasta portata. In molti casi, questi problemi derivano dalla mancanza di test approfonditi e di una efficace supervisione durante le modifiche del sistema.
  • Mancanza di formazione adeguata. Senza una formazione adeguata, è più probabile che i dipendenti attuino procedure scorrette che potrebbero causare interruzioni IT. Assicurarsi che il personale conosca bene i sistemi che gestisce e sia consapevole dei potenziali rischi è fondamentale per evitare che commetta errori.

Fattori esterni: attacchi informatici e violazioni della sicurezza

Le minacce alla sicurezza informatica sono un rischio sempre più presente per le aziende di qualsiasi settore e dimensione. Gli attacchi informatici, tra cui ransomware, attacchi DDoS (distributed denial-of-service) e violazioni dei dati, possono causare interruzioni IT onerose e complesse da risolvere. 

 

 

Impatto delle interruzioni IT sulle aziende

Le interruzioni IT possono bloccare le operazioni aziendali, causando tempi di inattività e perdita di produttività. L'impossibilità di accedere a sistemi o dati critici può ritardare lo svolgimento dei progetti e causare serie inefficienze operative.

Anche la fornitura di servizi ai clienti ne risente. Ritardi, errori o servizi di scarsa qualità possono impattare negativamente sulle modalità di interazione con il pubblico e portare alla perdita di opportunità commerciali.

Possiamo sintetizzare le conseguenze negative di un IT outage in quattro punti:

  • Tempi di inattività e perdite di produttività. Ogni minuto di inattività si traduce in una perdita di produttività. I dipendenti non sono in grado di svolgere al meglio le proprie attività e i processi chiave vengono ritardati. Tutto questo, per le attività a contatto con il pubblico, può comportare una mancata vendita o addirittura compromettere definitivamente la relazione con il cliente.
  • Costi diretti delle interruzioni. Rientrano in questa categoria le spese per le riparazioni, gli straordinari del personale che lavora per risolvere i problemi, i compensi per consulenze esterne, l’esborso per l’acquisto di apparecchiature sostitutive.
  • Impatto finanziario a lungo termine. Oltre ai costi immediati, le interruzioni IT possono avere implicazioni finanziarie a lungo termine. Tra queste rientrano la perdita di fatturato dovuta ai tempi di inattività e le potenziali sanzioni per il mancato rispetto degli obblighi contrattuali.
  • Effetti sull'immagine del marchio. Le interruzioni IT possono danneggiare la reputazione di un’azienda. Una volta persa, la fiducia del cliente è difficile da ricostruire. Tra l’altro, interruzioni prolungate o ripetute possono spingere i clienti verso la concorrenza.

In sintesi, poche cose sono più costose, in termini di risorse finanziarie spese, tempo perso e fidelizzazione mancata, dei tempi di inattività (downtime) che seguono a una interruzione IT. Secondo le ultime ricerche, il costo medio dei tempi di inattività si aggira attorno ai 9.000 dollari al minuto per le grandi organizzazioni. 

Per le aziende ad alto rischio come la finanza e l’assistenza sanitaria, il downtime può costare più di 5 milioni di dollari all'ora, e questo senza includere eventuali multe o sanzioni. 

Strategie per prevenire le interruzioni IT

Per prevenire le interruzioni IT è necessario un approccio multiforme che include la creazione di un'infrastruttura resiliente, l'adozione di strumenti di monitoraggio proattivi e la garanzia di una formazione continua dei dipendenti. 

Concentrandosi su queste strategie chiave, le aziende possono ridurre il rischio di interruzioni, mantenere la continuità operativa e salvaguardare la propria reputazione. Approfondiamo.

Implementazione di un’infrastruttura IT resiliente e aggiornata

Costruire un’infrastruttura IT resiliente comporta l’investimento in hardware di alta qualità. Questa strategia assicura la ridondanza nei sistemi critici e prevede l’adozione delle best practice per definire l'architettura IT.

Una manutenzione regolare e aggiornamenti tempestivi sono essenziali per mantenere i sistemi IT in funzione senza problemi. Un'assistenza proattiva può infatti prevenire molti dei guasti tecnici che portano alle interruzioni.

Adozione di strumenti di monitoraggio e gestione proattivi

Strumenti di monitoraggio avanzati, come quelli offerti da piattaforme come EV Observe, possono fornire informazioni in tempo reale sulle prestazioni del sistema e aiutare a individuare potenziali problemi prima che degenerino in interruzioni vere e proprie.

EV Observe è una piattaforma di monitoraggio per reti, IoT, infrastrutture IT, cloud e monitoraggio delle applicazioni che offre un’esperienza di servizio end-to-end. Da un lato individua modelli e tendenze che permettono alle aziende di identificare potenziali problemi e adottare tempestivamente misure preventive e dall’altro mette i team in condizione di concentrarsi sulla distribuzione del valore e sull'innovazione. 

Formazione dei dipendenti e best practice

I programmi di formazione continua sono essenziali per tenere informati i dipendenti sulle ultime tecnologie e sulle principali best practice. Una formazione regolare può ridurre la probabilità di errori umani e garantire che il personale sia preparato a gestire efficacemente i sistemi IT.

Anche incoraggiare una cultura di vigilanza significa promuovere un ambiente in cui i dipendenti siano consapevoli dei potenziali rischi IT e proattivi nel segnalare i problemi. 

Le migliori risposte alle interruzioni IT

In caso di interruzione dei servizi IT, una risposta rapida e ben coordinata è fondamentale per ridurre al minimo i disagi e ripristinare le normali operazioni. Tre risposte in particolare si dimostrano efficaci.

  • Sviluppo di un piano completo. Un piano efficace delinea i passaggi da intraprendere durante un'interruzione, stabilisce ruoli e responsabilità e definisce passaggi e tempi di azione. Dopo un'interruzione, la priorità è ripristinare le normali operazioni il più rapidamente possibile. Ciò può comportare l'utilizzo di sistemi di backup, il reindirizzamento del traffico o l'applicazione di correzioni di emergenza.
  • Comunicazione efficace a tutte le parti interessate. Durante un'interruzione IT, una comunicazione trasparente e comprensibile è essenziale. Mantenere informati dipendenti, clienti e partner sulla situazione effettiva e sui passaggi intrapresi per risolvere i problemi può aiutare a gestire le aspettative attenuando la frustrazione e mantenendo alto il livello di fiducia. 
  • Conduzione di analisi delle cause principali e implementazione di miglioramenti. Comprendere cosa ha provocato l'interruzione può aiutare a prevenire incidenti simili in futuro. La tecnologia di automazione dei processi EV Reach e le soluzioni di accesso al supporto remoto permettono di avere una visione end-to-end completa ed esaustiva di tutti i servizi IT, dall'infrastruttura agli endpoint. Offrono al contempo la possibilità di risolvere i problemi in modo proattivo e cioè introducendo i miglioramenti necessari prima che abbiano la possibilità di avere un impatto sul business.

Tendenze future nella gestione delle interruzioni IT

Integrando funzionalità AIOps, strumenti innovativi come EV Reach e EV Observe sono in grado di analizzare gli enormi volumi di dati provenienti da molteplici componenti dell'infrastruttura IT. 

Le informazioni ottenute sono poi “ripulite” e utilizzate per diagnosticare le cause principali e segnalarle alle aree IT e DevOps che possono rispondere e correggere rapidamente. In alcuni casi il sistema risolve il problema automaticamente senza l'intervento umano. 

Man mano che il panorama delle minacce si evolve, devono evolversi anche le strategie di gestione delle interruzioni IT. La sicurezza informatica rimane una delle principali preoccupazioni, con nuovi tipi di attacchi che emergono regolarmente. 

Il tema della cybersecurity si intreccia con quello dell'IT Service Management (ITSM). Il framework ITSM offre infatti un insieme di linee guida per la gestione e l'ottimizzazione dei servizi IT. 

L'integrazione dei processi di sicurezza e del pensiero sulla sicurezza direttamente con ciò che sta accadendo nel resto del reparto IT può contribuire significativamente a ridurre i rischi, diminuire i tempi di inattività e aumentare la soddisfazione degli utenti. 

Conclusione

Le interruzioni IT sono un rischio inevitabile nell’attuale ambiente aziendale altamente digitalizzato, ma il loro impatto può essere mitigato con le giuste strategie e gli strumenti più appropriati. 

Investendo in infrastrutture solide, monitoraggio proattivo, formazione regolare e pianificazione completa della risposta agli incidenti, le aziende possono ridurre la probabilità di interruzioni e contenere i costi quando si verificano. 

Le lezioni apprese da recenti incidenti, come l’IT outage di CrowdStrike-Windows, sottolineano l'importanza della vigilanza, della preparazione e del miglioramento continuo nella gestione IT.

FAQs

Cosa ha causato la recente interruzione IT che ha coinvolto CrowdStrike e Windows?

Il global IT outage del 19 luglio è stato causato da un aggiornamento della piattaforma di sicurezza informatica Falcon di CrowdStrike. Questo aggiornamento, pensato per migliorare la sicurezza, ha interagito in modo scorretto con i sistemi Microsoft Windows, causando diffusi errori Blue Screen of Death (BSOD). In sostanza, lo stesso software progettato per proteggere i sistemi ne ha inavvertitamente causato l'arresto anomalo, dimostrando le complessità e i rischi impliciti negli aggiornamenti dei sistemi IT.

Come possono le aziende prevenire le interruzioni IT e ridurne al minimo l'impatto?

Prevenire le interruzioni IT richiede di intervenire su più fronti: creazione di un'infrastruttura IT resiliente, adozione di strumenti di monitoraggio proattivi come EV Observe e formazione continua dei dipendenti. Queste strategie aiutano a identificare e risolvere potenziali problemi prima che degenerino, a mantenere la continuità aziendale e a salvaguardare la reputazione di un'azienda riducendo al minimo interruzioni e tempi di inattività.

EasyVista

EasyVista is a global software provider of intelligent solutions for enterprise service management, remote support, and self-healing technologies. Leveraging the power of ITSM, Self-Help, AI, background systems management, and IT process automation, EasyVista makes it easy for companies to embrace a customer-focused, proactive, and predictive approach to their service and support delivery. Today, EasyVista helps over 3,000+ enterprises around the world to accelerate digital transformation, empowering leaders to improve employee productivity, reduce operating costs, and increase employee and customer satisfaction across financial services, healthcare, education, manufacturing, and other industries.