Inchiesta
Il sostenibile peso della memoria
Dove e come conservare i dati in modo che siano facilmente consultabili, aggregabili e sicuri. Le pratiche più evolute di storage, dalle soluzioni as-a-service alla virtualizzazione, passando per la deduplicazione e per gli annosi aspetti legali della conservazione
Gli esperimenti in corso al Large Hadron Collider sotto il Cern di Ginevra generano 40 terabyte di dati ogni secondo. Una mole che nessuno è al momento in grado di archiviare in vista dell'analisi. Nell'attesa che l'industria dello storage trovi la soluzione, gli scienziati si accontentano di salvare il salvabile e lasciare andare quello che proprio non sta nelle memorie dei data center ginevrini e di quelli sparsi in tutto il mondo e ad essi collegati. Sperando ovviamente che tra i dati persi non si nasconda il misterioso e ricercato bosone di Higgs.
Problemi dall'ordine di grandezza unici nel loro genere ma nella sostanza non troppo dissimili da quelli che deve affrontare ogni azienda, quali che siano le sue dimensioni, e naturalmente anche la pubblica amministrazione. Anzi soprattutto la P.A. che da sempre è tra i principali generatori di informazioni da conservare e che da qualche anno si sta organizzando per rendere i dati sempre più facilmente disponibili ai cittadini. Già questo basterebbe a rendere chiaro che l'archiviazione di un'enorme e sempre crescente quantità dati di per sé è un problema sufficiente a complicare la vita di tutti i responsabili dell'It pubblico o privato. Ma l'information overload in salsa pubblica ha delle caratteristiche particolari, che prendono la forma dell'indispensabile contesto legale di tutela e sicurezza delle informazioni che soprattutto vincola le pratiche di conservazione con una cogenza particolarmente rilevante.
Il problema che oggi affrontano i responsabili della conservazione può essere così descritto: tanti dati già registrati, spesso in formati diversi tra loro, e molti di più in arrivo a ciclo continuo – globalmente i dati raddoppiano ogni 18 mesi, quindi tra tre anni si dovrà gestire una mole quattro volte quella odierna, e tre anni dopo saranno sedici volte tanto - il tutto con la necessità di non perderli, poterne certificare la correttezza e possibilmente (ma non ce ne occuperemo in questa cover story) di renderli disponibili per la loro consultazione e analisi. Come fare? Le soluzioni che si profilano più vantaggiose sono quelle che prevedono l'esternalizzazione dello storage, in macchine che risiedono fuori dalle mura degli uffici pubblici, spesso in configurazione cloud (cioè riposte non su un particolare server ma in un gruppo di database che ottimizzano il flusso in base alle esigenze del cliente) come promosso dal governo Britannico e da quello Usa. Nel Regno Unito si sta predisponendo una infrastruttura cloud computing per l'archiviazione dove convergeranno tutte le banche dati del settore pubblico. Obama ha invece affidato (vedi cover story dedicata al cloud computing sul numero 11-2009 di eGov) al chief information officer federale, Vivek Kundra, il compito di pubblicizzare l'offerta di soluzioni cloud governative e incrementarle. Google sta attrezzando insieme al governo federale dei server per una "nuvola" appositamente configurata per le particolari esigenze di sicurezza.
Uno degli studi più aggiornati del settore è quello realizzato dall'istituto indipendente The Info Pro, che ogni anno pubblica lo Storage Networking Heat Index, che scatta l'istantanea delle tendenze nel settore. Oltre a confermare la predisposizione all'esternalizzazione degli archivi e l'adozione di soluzioni cloud e modulari come lo storage as a aservice, l'indice rileva una soluzione chiesta con sempre maggiore insistenza dal mercato pubblico e privato: la deduplicazione. Se infatti uno dei mantra dello storage negli anni scorsi era stato "ridondanza", e cioè la duplicazione dei dati per garantirne la sopravvivenza in caso di guasto ai database, oggi il problema è opposto. La ridondanza, indispensabile dal punto di vista teorico, in pratica ha raddoppiato dati già presenti identici in diversi database della P.A., sommandoli al flusso di nuovi dati da archiviare e, questi sì, duplicare. Robert Stevenson, responsabile dell'indice, ha dichiarato che è il quinto anno consecutivo che la voce deduplicazione è presente tra le esigenze dei manager della conservazione dati, ma quest'anno sembra essere diventata un'urgenza imprescindibile. I server aziendali e pubblici sono intasati da copie di copie di copie. Bisogna cancellarne qualcuna, anzi possibilmente tutte tranne due, l'originale e la sua copia di sicurezza indispensabile in caso di disaster recovery. In sintesi le operazioni di deduplicazione prevedono un software che segmenta il flusso dei dati in arrivo, identifica i segmenti di dati e li confronta con i segmenti di dati già memorizzati. Se un segmento in ingresso è un doppione, non viene più immagazzinato una seconda volta ma viene creato solamente un riferimento ad esso. Si può deduplicare in-line, cioè processando i dati in ingresso e rigettando i doppioni prima di registrarli su disco; oppure post-processo, confrontandoli dopo averli registrati e cancellando dal disco magnetico quelli già presenti nel database. La deduplicazione è una soluzione apprezzata dal mercato ma ancora poco diffusa nel settore pubblico. Ci sono però delle felici eccezioni, anche in Italia (Comune di Roma), che dimostrano che lo strumento è particolarmente efficace, arrivando ad abbattere i costi di conservazione e trasmissione dati. Dal punto di vista tecnologico la P.A. nostrana viaggia a due velocità in tema di soluzioni per lo storage. Sanità (dove l'adozione dei microfilm per le cartelle risolveva una parte dei problemi di spazio in archivio quando ancora non si chiamava storage) e fisco adottano soluzioni al passo con gli ultimi aggiornamenti del mercato; la P.A. locale e centrale invece ha ritmi molto più rilassati nella maggior parte dei casi. Il motivo della differenza è tutto nell'importanza e nella quantità di dati trattati. La situazione non è drammatica, le soluzioni tecnologiche di certo non mancano e tra i responsabili della conservazione e quelli dell'It degli uffici pubblici c'è sensibilità al problema e discreta conoscenza dei rimedi. Dal punto di vista normativo, non meno importante, l'Italia vive invece una condizione contraddittoria, come conferma Marco Donnamaria, direttore vendite e marketing di IDM, che muovendosi da anni nel mercato dello storage per il settore pubblico ha una notevole esperienza di norme e leggi in materia. “Il paradosso che viviamo in Italia è quello di essere stati tra i primi a partire e tra gli ultimi ad arrivare. Nel 2002 l'allora Ministro per l'innovazione e le tecnologie, Lucio Stanca, lanciò le basi legislative per la dematerializzazione e le indicazioni sulla conservazione con la norma per il protocollo informatico, ponendo la nostra pubblica amministrazione in vantaggio non solo su quelle di altri Paesi europei ma anche del settore privato, che si adeguò nel 2004”. Purtroppo però una parte delle disposizioni in materia sono rimaste sulla carta e la stessa carta normativa si è nel tempo aggravata di modifiche e aggiunte non sempre coerenti o implementabili nel corpo giuridico per la pubblica amministrazione digitale. Come è accaduto recentemente con le modifiche al codice di amministrazione digitale entrate in vigore il 19 febbraio. Modifiche che complicano la gestione dei dati appesantendo il contesto digitale di ristrettezze tipiche del vecchio mondo cartaceo, introducendo artificiose distinzioni tra le varie copie digitali di un originale cartaceo e di un originale digitale. Modifiche che vanno a loro volta modificate come richiesto (vedi intervista) da un consorzio trasversale di attori coinvolti nel mercato che va dagli operatori e responsabili della conservazione digitale (Anorc) ad Assintel, l'associazione di imprese Ict di Confcommercio, per evitare che il sistema già congestionato si paralizzi, e che la P.A. italiana si isoli dal resto del mondo digitale prigioniera di una normativa sorda alle regole del contesto cui si applica.
IL CASO - Marche: archivi più flessibili grazie a NetApp
Ridondanza e virtualizzazione. Sono queste le parole d'ordine che hanno caratterizzato l'intervento di NetApp a beneficio di Astea, società ex municipalizzata che fornisce energia e acqua potabile a 11 comuni tra Ancona e Macerata, che conta circa un centinaio di postazioni e gestisce una quindicina di server fisici assieme a un numero in crescita costante di server virtuali. Per far fronte a un volume sempre maggiore di spazio disponibile per archiviare le informazioni passate, presenti e future del sistema e l’esigenza di avere copie in breve tempo NetApp ha realizzato un ambiente storage ridondante per i dati di produzione, sia per quanto riguarda i file che i blocchi (unità logiche), eliminando lo storage interno ai server. Astea è ora in grado di gestire la ridondanza dei collegamenti tra server e storage con una soluzione ibrida i-SCSI e Fibre Channel grazie a uno switch gigabyte ethernet che ha permesso di ottenere la completa ridondanza senza dover acquistare uno switch Fibre Channel, soluzione possibile solo grazie all’architettura NetApp. In questo modo si è ottenuta la ridondanza di cui c'era bisogno a livello di storage, e la possibilità di replicare velocemente i dati in ambiente di “stage” senza passare per le macchine. Infine, per quanto riguarda la gestione clienti sviluppata dalla società Engineering su database Oracle, Astea ha ottenuto grazie alle soluzioni NetApp un consolidamento della posta elettronica, del file server e in ultimo la gestione di un ambiente di macchine virtuali. Consolidamento della connessione ibrida i-SCSI e Fibre Channel nella quale NetApp è risultata eccellente per le esigenze di consolidamento dei dati di Astea.
Raffaele Mastrolonardo e Gabriele De Palma
Argomenti
Segnala a un amico
Ricerca articoli
Articoli correlati
eventiARCHIVIO
-
Palazzo della Provincia di Perugia
11/05/2010
L'unione europea e la nuova cittadinanza
-
17/05/2010
GOVERNARE CON LA RETE
-
ROMA, FORUMP.A.
17/05/2010
Le innovazioni di sistema negli Enti Locali: risultati e prospettive del Programma Elisa
-
ROMA
19/05/2010
GOVERNARE CON LA RETE
-
ForumP.A., FIera di Roma
19/05/2010
Barcamp Innovatori P.A.















