Migliorare l'agilità DevOps e proteggere la pipeline di distribuzione:

Con soluzioni di business assurance progettate per l'era digitale

Il quadro generale

Nell'era digitale, i servizi digitali sono al centro di un'innovazione dirompente. L'agilità nella pianificazione, nella consegna, nell'integrazione, nel collaudo e nella messa in esercizio continui di applicazioni e servizi fanno la differenza tra vincitori e vinti in questo ambiente aziendale altamente competitivo. Da un parte, l'automazione di questi processi offre enormi vantaggi per la fornitura continua ma, dall'altra parte, sposta i vincoli all'ambiente di produzione che ora orienta il flusso complessivo del valore ai clienti. Sfortunatamente la telemetria a livello di applicazione utilizzata dai team DevOps per il ciclo di feedback è inefficiente poiché molti dei vincoli sono a livello di sistema. Tali vincoli comprendono tutti i sottosistemi infrastrutturali associati alla fornitura del servizio e all'applicazione. La visibilità a livello di sistema, la telemetria e le funzionalità di valutazione basate sul monitoraggio continuo e sull'analisi del traffico IP di NETSCOUT consentono alle organizzazioni DevOps di diventare più agili ed efficienti e aiutano le loro imprese a ottenere un vantaggio competitivo nel campo di battaglia digitale.

Le principali sfide che DevOps sta affrontando e le rispettive soluzioni NETSCOUT descritte in questa pagina sono riassunte nella Tabella 1 sottoriportata.

Tabella 1: Far fronte alle sfide DevOps

Sfide DevOps

Proposta di valore NETSCOUT

Diventare più produttivi e agili, offrendo servizi più veloci e con meno risorse Consentire a DevOps di raggiungere più risultati con meno risorse tramite la piattaforma di telemetria a livello di servizio e una consapevolezza comune delle situazioni
Minimizzare l'impatto delle interruzioni Ridurre il tempo medio delle riparazioni (MTTR)
Analizzare continuamente la capacità e la disponibilità delle risorse IT globali per l'implementazione di nuovi servizi Efficace ciclo loop di feedback basato sul monitoraggio e sull’analisi in tempo reale e continui della capacità delle risorse di fornitura del servizio
Garantire qualità, sicurezza e disponibilità del servizio Soluzioni di business assurance per mitigare i rischi associati alla qualità, alla sicurezza e alla disponibilità del servizio

 

L'enigma dell’agilità DevOps


DevOps è l'epicentro di questa innovazione dirompente e le sue prestazioni sono direttamente legate ai risultati aziendali. Purtroppo all’aumentare della rapidità del canale di distribuzione, aumenta anche la resistenza generata dal crescente “caos” creato dalla maggiore velocità di funzionamento. Sebbene l'automazione e l'adozione di principi di leadership agili aiutino a controllare questo caos per la fornitura continua, aumenta anche il caos nell'ambiente di produzione. Di conseguenza, i team operativi sono ora a rischio di diventare la causa del rallentamento che limita il flusso di valore complessivo per i clienti. Il primo passo che il team operativo deve intraprendere per affrontare questa sfida è quello di ottenere una visibilità continua e in tempo reale basata sulla telemetria a livello di sistema. Il team Ops ha bisogno di usare queste informazioni per ridurre il MTTR e stabilire un ciclo di feedback efficace con Dev, QA, Sec e Ops. Questo obiettivo è estremamente difficile se non impossibile da realizzare con le tradizionali tecnologie Application Performance Management (APM) come agenti e strumentazione bytecode. Il motivo è che gli strumenti APM rivelano solo la crescente telemetria a livello di applicazione, al contrario di tutta la telemetria end-to-end a livello di sistema. Le soluzioni di business assurance (BA) di NETSCOUT utilizzano le tecnologie basate sul traffico IP per risolvere questa sfida e aiutano DevOps a ottenere la visibilità a livello di sistema necessaria per proteggere il canale di distribuzione che funziona a una velocità maggiore. Come illustrato nella Figura 1 sottoriportata, questo approccio è più agile ed efficiente in quanto qualsiasi punto della strumentazione per il traffico IP offre informazioni su tutte le applicazioni e le rispettive metriche senza la necessità di strumentazione bytecode di ogni singola applicazione.

Garantire la messa in esercizio DevOps
Figura 1: Assicurare il funzionamento del canale di distribuzione con visibilità a livello di sistema

Vedere “tutta la luna” 1


Le soluzioni di Business Assurance NETSCOUT consentono alle organizzazioni DevOps di vedere “tutta la luna” monitorando continuamente il traffico IP che attraversa l’infrastruttura di fornitura del servizio, individuando in modo proattivo le degradazioni dei servizi e fornendo informazioni disponibili di tutte le interdipendenze dei servizi necessarie per ridurre il MTTR e risolvere i problemi prima che si verifichino conseguenze per gli utenti.

Questa visibilità a livello di sistema end-to-end include la telemetria dei parametri di carico, della latenza e degli errori per tutti i sistemi di fornitura del servizio e le interdipendenze tra rete, server, service enabler, database e applicazioni. Queste informazioni non solo aiutano a migliorare la velocità di pianificazione, fornitura, integrazione, collaudo e messa in esercizio continui ma ottimizzano anche le efficienze DevOps e forniscono un vantaggio competitivo nel campo di battaglia digitale.

Ottimizzazione delle efficienze operative DevOps


La comunicazione continua tra i team Dev e Ops è un prerequisito per una maggiore produttività DevOps, ma non è sufficiente. Anche se, teoricamente, il team di DevOps potrebbe ottenere una consapevolezza situazionale comune completamente trasparente tra i team Dev e Ops, l’analisi precisa della “situazione” influenzerà l’efficienza di questa consapevolezza comune. L’identificazione rapida, mediante l’analisi della situazione, della causa principale a livello di sistema in tutti i sistemi IT rilevanti e l'applicazione non solo ridurrebbe drasticamente il MTTR, ma fungerebbe anche da moltiplicatore di forza che permette a DevOps di effettuare più lavoro con meno risorse. Inoltre, sarebbe molto più efficiente per raggiungere questa riduzione dell'MTTR senza la necessità per il team Dev di utilizzare la strumentazione bytecode per ogni applicazione.

Ad esempio, poiché solo una parte dei problemi di recapito del servizio è correlata a un'applicazione specifica, la produttività degli sviluppatori viene ottimizzata se sono coinvolti solo quando la causa principale è correlata alla loro specifica applicazione. Con una visibilità a livello di applicazione, invece, il team di sviluppo non sa se la causa principale di un problema di prestazioni dell'applicazione è correlata al codice dell'applicazione o a un altro sistema IT. Ciò comporterà uno spreco di tempo prezioso da parte del team Dev incaricato di fornire assistenza per risolvere problemi non correlati alle applicazioni. Il team Ops finirebbe anche per dedicare più tempo alla risoluzione dei problemi della causa principale per via della mancanza di visibilità nelle interdipendenze tra i sistemi IT e le applicazioni. Ciò si traduce nella creazione di “zone di inefficienza” sia per Dev che per Ops a causa del tempo e degli sforzi sprecati, come illustrato nella figura 2 sottoriportata.

Telemetria delle fasi APM
Figura 2: i vantaggi della migrazione alla telemetria a livello di sistema: agilità elevata e maggiore efficienza

L'approccio di una telemetria a livello di sistema sfrutta una valutazione efficace del sistema basata sulla visibilità end-to-end in tutte le interdipendenze di recapito del servizio per identificare rapidamente la causa principale dei problemi di servizio. Il tempo medio che un’organizzazione IT impiega per completare il processo di triage è chiamato tempo medio per la conoscenza (“Mean Time To Knowledge”, MTTK) e secondo ZK Research, l’MTTK rappresenta il 90% del tempo medio complessivo alla riparazione (MTTR) per i problemi a livello di prestazione dei servizi.

L'approccio della telemetria a livello di sistema si basa sulle metriche delle prestazioni in tutta l'infrastruttura di fornitura del servizio a livello sia fisico sia virtuale, in loco e da remoto nei cloud pubblici e privati. Tale approccio offre una capacità unica in termini di analisi delle prestazioni, degli indicatori di traffico, del carico e degli errori nonché per offrire flussi di lavoro contestuali per una valutazione rapida e per trovare la causa principale dei problemi che provocano il peggioramento delle prestazioni dell'applicazione. L'efficace valutazione del servizio può accelerare significativamente l’MTTR fino all'80% per consentire ai team di sviluppo di dedicare la maggior parte del tempo e delle risorse in modo produttivo alla fornitura di nuove applicazioni e riduce il sovraccarico per le operazioni associate ai servizi di riparazione a richiesta. Ciò comporta una minore quantità di tempo passato a pianificare nonché operazioni, costi di assistenza e complessità di minore entità. In definitiva, con la telemetria a livello di sistema, le organizzazioni DevOps possono beneficiare di un quadro completo,[2] migliorare la velocità e ottimizzare l'efficienza.

Creazione di telemetria a livello di sistema: smart data e analisi di prima qualità

Smart Data


Sebbene raggiungere una visibilità a livello di sistema in tutte le applicazioni e in tutti i sistemi di fornitura del servizio e nelle loro interdipendenze possano sembrare un'impresa ardua, ciò è possibile con gli smart data e con analisi di prima qualità. I dati relativi al traffico IP sono alla base degli smart data e vengono utilizzati per generare metadati altamente scalabili che offrono una telemetria storica e in tempo reale di tutti i componenti del sistema, comprese le reti fisiche e virtuali, le applicazioni a “n” livelli, i carichi di lavoro, i protocolli, i server, i database, gli utenti e i dispositivi. I principali vantaggi dell'utilizzo dei dati relativi al traffico IP includono:

  • Telemetria a livello di sistema e in tempo reale – Poiché ogni azione e transazione è incapsulata in pacchetti IP che attraversano l'infrastruttura fisica e virtuale, i dati sul traffico IP offrono il miglior punto di osservazione per la visibilità end-to-end
  • Informazioni disponibili – Il traffico IP contiene tutti i dati[3] necessari per ottenere una conoscenza approfondita dei problemi di gestione delle prestazioni dell'applicazione e del sistema
  • Informazioni indipendenti dalle applicazioni – I dati del traffico IP possono essere utilizzati per monitorare qualsiasi applicazione tradizionale, mobile, personalizzata o standard indipendentemente dal codice sorgente e senza necessità di agenti o strumentazioni bytecode
  • Massima scalabilità – La tecnologia IP basata su standard è ben strutturata e quindi più adatta per la valutazione di sistemi scalabili che richiedono di raccogliere, normalizzare, correlare, organizzare e analizzare continuamente grandi volumi di dati in un sistema contestuale

Combinazione di smart data con analisi di prima qualità


Figura 3: fondamenti di telemetria a livello di sistema: combinazione di smart data e analisi di prima qualità

 

Analisi di ottima qualità


Quando gli smart data vengono combinati con analisi dalla qualità elevata, possono fornire informazioni importanti sulle metriche delle prestazioni del servizio e dell'applicazione, quali i volumi di traffico dell'applicazione, i tempi di risposta del server delle applicazioni, la produttività dei server, i conteggi degli errori aggregati e i codici di errori specifici per i server e il dominio delle applicazioni. Inoltre, gli smart data possono rivelare tutte le dipendenze dell'applicazione e supportare la transizione contestuale su più livelli di analisi facilitando il passaggio efficiente delle attività per far fronte agli incidenti tra i diversi gruppi IT funzionali in tutto il processo di valutazione della causa principale. Di conseguenza, il passaggio al rispettivo team di sviluppo diventa necessario solo se la causa principale è associata all'applicazione specifica fornita.

La fase finale dell'ottimizzazione DevOps può essere eseguita con un'analisi predittiva che rileva in modo proattivo i peggioramenti dei servizi prima che gli effetti interessino più utenti. Stabilendo automaticamente le linee di riferimento delle prestazioni, gli avvisi possono essere generati in funzione di soglie predefinite o di deviazioni rispetto alle linee di riferimento. Le deviazioni includono l'aumento o il calo dell'utilizzo dei link, i tassi di fallimento delle transazioni applicative e la capacità di risposta. Il sistema di analisi deve inoltre modificare automaticamente le linee di riferimento nel tempo per adattarsi alle modifiche graduali nell'utilizzo del servizio mentre fornisce avvisi tempestivi sulle anomalie delle prestazioni. Utilizzando questi dati predittivi, le organizzazioni DevOps possono ottenere visibilità nei problemi emergenti delle prestazioni del servizio prima che influiscano su più utenti e contestualmente valutare e analizzare i risultati e le cause di fondo. Il risultato complessivo dell'utilizzo di smart data e di analisi di ottima qualità è una drastica riduzione di MTTK e MTTR come illustrato nella figura 4 sottoriportata.

Riduzione dell'MTTR
Figura 4: efficace sistema di valutazione utilizzando una telemetria a livello di sistema e analisi di ottima qualità

Ulteriori vantaggi della telemetria e della valutazione a livello di sistema includono una migliore disponibilità del servizio e l'esperienza degli utenti e la capacità di scalare i servizi per supportare milioni di utenti nell’ambiente di produzione.

Soluzioni NETSCOUT per esigenze DevOps

Soluzioni di efficienza operativa
La piattaforma di service assurance nGeniusONE di NETSCOUT riduce drasticamente il MTTR e MTTK e funge da moltiplicatore di forza che consente ai reparti Ops di raggiungere più risultati con meno risorse, riducendo al minimo il lavoro non pianificato. Questa abilità consente inoltre di aumentare al massimo la produttività degli sviluppatori riducendo il lavoro in eccesso per la gestione dei problemi relativi ad altri sistemi IT. L'efficienza fondamentale è realizzata con nGeniusONE mediante:

  • la rilevazione proattiva della degradazione dei servizi in base alle deviazioni dalle linee di riferimento delle prestazioni o dalle soglie predefinite
  • un supporto per flussi di lavoro intuitivi top-down per la valutazione del sistema che riduce efficacemente l’MTTK rilevando la causa principale in tutto il sistema, compresa la varietà di applicazioni a “n” livelli, i sistemi delle infrastrutture IT e tutte le rispettive interdipendenze
  • il monitoraggio di qualsiasi applicazione nuova o legacy e dei sistemi delle infrastrutture

Soluzioni agili per una messa in esercizio continua
La piattaforma nGeniusONE di NETSCOUT offre telemetria in tempo reale e correlata all'analisi di tendenza[4] e analisi per fornire un ciclo di feedback che protegge il canale di distribuzione e aumenta l'agilità DevOps. Queste funzionalità includono:

  • Informazioni dettagliate in tutti i sistemi di fornitura del servizio e analisi delle cause principali tenendo conto di tutte le interdipendenze tra le applicazioni e l'infrastruttura in loco e basata su cloud.
    • La tecnologia Adaptive Service Intelligence (ASI) Plus in esecuzione sulle apparecchiature InfiniStreamNG offre visibilità in tempo reale dei sistemi e delle interdipendenze DevOps, comprese le reti fisiche e virtuali, le applicazioni a “n” livelli, i carichi di lavoro, i protocolli, i server, i database, gli utenti e i dispositivi
    • La tecnologia ASI Plus utilizza il traffico IP come fonte di smart data che è ideale per il monitoraggio di micro-servizi e degli ambienti cloud o locali complessi
    • ASI eXtender (ASI-X) consente di dotare di strumenti qualsiasi applicazione personalizzata e di monitorarla
  • Dashboard personalizzabili, report e mappe delle dipendenze dei servizi consentono di stabilire una consapevolezza situazionale comune tra i team Dev, QA e Ops e di semplificare il ciclo di feedback
  • nGeniusPULSE integra le funzionalità di nGeniusONE con la visibilità per la service assurance dell’applicazione attraverso le diverse combinazioni di architetture cloud private, ibride, SaaS e pubbliche che le imprese stanno attualmente mettendo in esercizio e sono quindi fondamentali per il canale di distribuzione

Pianificazione DevOps
La piattaforma nGeniusONE permette ai team Ops di ridurre il rischio di affidabilità dell'infrastruttura di fornitura del servizio associato alla distribuzione continua mediante:

  • Analisi in tempo reale e continua della capacità delle risorse di fornitura del servizio globali, prima che il team Ops accetti il lavoro da Dev.
  • Ciò include una mappa delle dipendenze del servizio automatizzata che offre informazioni su carico, latenza ed errori nell'intera infrastruttura di fornitura del servizio e capacità dell’infrastruttura a livello di rete, collegamento e server
  • L'aggiunta di nGeniusPULSE con la sua capacità di testare i servizi basati su cloud per la disponibilità, la capacità di risposta e il rispetto dei livelli di servizio fornisce ai reparti DevOps le informazioni sul rischio di affidabilità associato all'implementazione continua

Attenuazione dei rischi aziendali
Le soluzioni di business assurance di NETSCOUT contribuiscono ad attenuare i rischi aziendali e a raggiungere i risultati sperati. Ciò è possibile con:

  • Una suite di soluzioni di service assurance nGeniusONE basate su ASI che contribuisce a ridurre l’MTTR e a migliorare la qualità del servizio e la disponibilità
  • Arbor Networks, il reparto sicurezza di NETSCOUT, aiuta a proteggere l'integrità e la disponibilità del servizio in caso di Distributed Denial of Service (DDoS) e di Advanced Persistent Threat (APT)

Riepilogo

Nell'era digitale, l'organizzazione DevOps può fare la differenza tra il successo e il fallimento di un’azienda. I fattori chiave di successo DevOps sono l'agilità, l'efficienza operativa e la capacità di ridurre i rischi aziendali che possono impedire alla società di raggiungere i risultati aziendali auspicati. Sebbene l'automazione e l'implementazione dei principi agili da parte dei reparti DevOps abbia contribuito a migliorare la velocità e l'efficienza di fornitura continua, l'ambiente di produzione è diventato il nuovo fattore limitante nel flusso di valore per i clienti. Tale limite non può essere superato in modo efficace dal team delle operazioni che si basano sulla visibilità a livello di applicazione e dal team di sviluppo che devono utilizzare la strumentazione bytecode per ogni applicazione. La visibilità a livello di sistema, la telemetria e le funzionalità di valutazione basate sul monitoraggio continuo e sull'analisi del traffico IP di NETSCOUT consentono alle organizzazioni DevOps di diventare più agili ed efficienti e aiutano le loro imprese a ottenere un vantaggio competitivo nel campo di battaglia digitale.

RISORSE

Opinione del cliente -

Schede tecniche
Panoramiche

[1]Dal testo della canzone The whole of the Moon -The Waterboys
[2] Dal testo della canzone The whole of the Moon - The Waterboys
[3]Livelli del modello OSI (Open System Interconnection) da 2 a 7
[4]Telemetria è il termine utilizzata dai reparti DevOps e include le metriche aziendali, infrastrutturali e relative alle applicazioni necessarie per monitorare il funzionamento dei sistemi in ambienti destinati alla produzione