Analisi dati esperimento MAGIC
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

"Magic è un esperimento per la rivelazione di raggi Gamma ad altissima energia, testimoni di processi molto violenti nell'universo come caduta di massa in un buco nero o esplosioni di stelle. I raggi gamma ad altissima energia ( E>50 GeV) possono essere rivelati da terra, in quanto producono una cascata di particelle quando interagiscono con l'atmosfera. La cascata di particelle produce un debole lampo di luce Cherenkov prodotta dalle particelle che viaggiano più veloci di quanto non si propaghi la luce nell'atmosfera. La luce Cherenkov viene raccolta da enormi telescopi e viene focalizzata sulla camera che produce un'immagine della cascata.
L'analisi dati per l'esperimento MAGIC consiste nella ricostruzione tridimensionale della cascata a partire dalle immagini Cherenkov: lo scopo principale è determinare la direzione e l'energia del raggio gamma che ha innescato la cascata.

Di fondamentale importanza risulta una costante e dettagliata simulazione sia delle cascate atmosferiche che della risposta del rivelatore in diverse condizioni di presa dati. Per questo motivo vengono generati continuamente dati simulati per validare i dati effettivamente acquisiti.

Le analisi prodotte dal nostro gruppo su CloudVeneto, sono state e sono oggetto di molti articoli scientifici pubblicati in prestigiose riviste internazionali. Tra questi articoli uno recente di grande rilievo è sull'associazione di una sorgente di raggi Gamma ad un evento di neutrino che ha inaugurato la nuova astrofisica "multimessaggera" con neutrini."


Prof. M. Mariotti


Multiparticle simulation of high intensity injectors
INFN Laboratori Nazionali di Legnaro

“New upgrade and application of the high intensity accelerators (e.g. Linac4, Fermilab, IFMIF, ESS) require multi-particle simulation of Columbian interactive system with demanding computing powers. The possibility to include new phenomena such as the secondary plasma evolution, generation and interaction with the primary beam in the beam dynamics calculation, is essential to understand the complex physics of these machines.

We are currently involved in the commissioning of the IFMIF-EVEDA prototype accelerator, the world leading accelerator of this type. We are using the Cloud to perform parallel simulations of the low energy transfer lines and source."


Dott. Michele Comunian


Studio della produzione del quark beauty nelle collisioni protone protone al collisore LHC
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

“Il gruppo LHCb del DFA G. Galilei e della Sezione di Padova dell’INFN è impegnato nello studio della produzione del quark beauty nelle collisioni protone protone al collisore LHC.
I quark beauty vengono identificati tramite la ricostruzione esclusiva di mesoni e barioni contenenti appunto il quark beauty, come ad esempio i mesoni neutri Bs, oppure inclusivamente: identificando i jet prodotti dall’adronizzazione di un quark beauty. Entrambe le tecniche richiedono sofisticati algoritmi di boosted decision trees o di deep neural network.

Dopo essere stati messi a punto, questi algoritmi devono essere applicati a una notevole mole di eventi per isolare il segnale di interesse fisico. Per tutte queste operazioni, che richiedono ingenti risorse di calcolo, nonché per l’archiviazione dei dati, vengono intensivamente usate le risorse di CloudVeneto."


Dott. Alessandro Bertolin


Simulazioni di reti complesse
Dipartimento di Ingegneria dell’Informazione

“Il gruppo SIGNET del Dipartimento di Ingegneria dell”informazione utilizza la piattaforma CloudVeneto per eseguire simulazioni di reti complesse.

In particolare, un progetto riguarda il testing di protocolli di comunicazioni sottomarini per mezzo di trasmissione di onde acustiche e ottiche.

La piattaforma consente di eseguire istanze multiple del simulatore ns2-miracle su cui è stato implementato un modulo (DESERT Underwater) che consente di riprodurre gli effetti della propagazione dei segnali acustici e ottici in un ambiente sottomarino. La complessità del modello richiede ingenti capacità di calcolo e di memoria che possono essere allocate a richiesta nella piattaforma CloudVeneto.

Un secondo progetto riguarda la simulazione di protocolli per comunicazioni radio a onde millimetriche (mmWave), ovvero ad altissima frequenza (GHz). In questo caso, si è sfruttata la possibilità di integrare il simulatore di rete ns-3 con alcuni protocolli disponibili per il sistema operativo Linux, ma non ancora implementati in ns-3 (ad esempio, alcune recenti versioni di TCP). Grazie alle risorse computazionali presenti su CloudVeneto è stato possibile aumentare il realismo e la complessità degli scenari simulati. L'aspetto più apprezzato è la gestione autonoma delle macchine virtuali.”


Dott. Andrea Zanella


Simulazioni di trasporto di carica per hopping in niobato di Litio
Dipartimento di Fisica e Astronomia

“Al momento stiamo usando le macchine virtuali per condurre simulazioni sistematiche di tipo Monte Carlo dedicate allo studio di materiali per applicazioni nel campo della fotonica. Le simulazioni mirano a riprodurre il trasporto di carica in niobato di litio al variare della concentrazione dei difetti presenti nel materiale, della temperatura e altri parametri microscopici.

Queste simulazioni richiedono tra una e due settimane di calcolo poichè una grande statistica è necessaria per avere buoni risultati. Per noi la funzionalità più importante al momento è la possibilità di poter far girare in ogni macchina virtuale una simulazione con una configurazione diversa di parametri per poter minimizzare i tempi di questo studio.”


Dott. Laura Vittadello, Dott. Marco Bazzan


Containerizzazione applicata alla sperimentazione e valutazione di architetture a micro-servizi, e alle soluzioni di orchestrazione dinamica.
Dipartimento di Matematica

“Al Dipartimento di Matematica, la gente che lavora con me si interessa di "containerizzazione" applicata alla sperimentazione e valutazione di architetture a micro-servizi, e alle soluzioni di orchestrazione dinamica.

Sul primo versante, in CloudVeneto abbiamo trovato generalmente adeguati e sufficienti l'ambiente e gli strumenti tecnologici dell'ecosistema OpenStack. Sul secondo versante stiamo ancora muovendo i primi passi, ma avremo presto bisogno di poter comparare diverse soluzioni allo stato dell'arte dell'orchestrazione e sottoporle a svariati scenari di carico per valutare la loro efficacia nella programmazione delle regole e delle azioni di riconfigurazione elastica.”


Prof. Tullio Vardanega


Esperimenti di reperimento dell’informazione
Dipartimento di Ingegneria dell’Informazione

“Il gruppo IMS del Dipartimento. di Ingegneria dell”informazione utilizza la piattaforma CloudVeneto per eseguire esperimenti di reperimento dell’informazione.

In particolare, si esegue l’indicizzazione automatica di grandi collezioni di documenti testuali che prevedono un’elevata frequenza di operazioni di input/output.

Gli indici creati sono mantenuti in memoria secondaria e vengono utilizzati per eseguire le operazioni di retrieval mediante diversi motori di ricerca (qualche centinaio). Inoltre, per ogni operazione di retrieval calcoliamo decine di misure di valutazione (come l’average precision) sulle quali eseguiamo delle analisi statistiche.

Le grandi moli di dati elaborate richiedono la disponibilità di un'elevata quantità di memoria centrale e memoria secondaria. Abbiamo utilizzato librerie Java e Matlab.”

Dott. Gianmaria Silvello


Data assimilation
Dipartimento di Ingegneria Civile Edile ed Ambientale

“Il gruppo di ricerca "Hydrological data assimilation" utilizza tecniche di “data assimilation” (DA), il cui scopo principale è di integrare direttamente nei modelli idrologici informazioni derivanti da osservazioni sperimentali, ottenendo così una stima ottimale dello stato del sistema e dei parametri. Le tecniche di DA permettono di aggiornare le predizioni modellistiche con dati misurati non appena questi diventano disponibili, riuscendo anche a fornire una stima degli errori e delle incertezze delle simulazioni.

Tra le varie tecniche di DA disponibili, l’ensemble Kalman filter (EnKF) riveste particolare interesse, grazie alla sua capacità di gestire problemi non lineari mediante un approccio di tipo Monte Carlo, il quale prevede l’approssimazione delle distribuzioni statistiche dei dati di input/output mediante l’utilizzo di centinaia o migliaia di simulazioni parallele. Per questo motivo, l’EnKF necessita tipicamente di grosse risorse computazionali, sia in termini di immagazzinamento dati che in termini di numero di CPU da utilizzare.

L'infrastruttura CloudVeneto permette di poter sfruttare al massimo le tecniche di DA e quindi di sviluppare strumenti scientifici all’avanguardia per la soluzione di problemi complessi in idrologia.”

Dott. Matteo Camporese


Risoluzione numerica di integrali ed equazioni differenziali
Dipartimento di Fisica e Astronomia

“Il gruppo di Cosmologia del Dipartimento di Fisica e Astronomia utilizza CloudVeneto per risolvere numericamente integrali ed equazioni differenziali necessari per studiare l'evoluzione temporale di diversi osservabili cosmologici, fra cui le anisotropie e distorsioni spettrali della radiazione cosmica di fondo. Lo studio di questi osservabili ci ha permesso di produrre forecasts su quelle che saranno la capacità di diversi esperimenti futuri (e.g., i satelliti PIXIE e CORE) di fornirci informazioni su vari modelli inflazionari.

Della piattaforma abbiamo in particolare apprezzato la possibilità di creare macchine virtuali con vari numeri di cores e varia quantità di RAM. Vista la grande quantità di memoria loro necessaria, le nostri particolari applicazioni sono infatti difficilmente ottimizzabili su sistemi a cluster. La possibilità di utilizzare molti cores con shared memory ci ha quindi permesso di sfruttare appieno le risorse disponibili.

Parimenti gradita è la possibilità di gestire autonomamente le proprie macchine virtuali.”

Dott. Andrea Ravenni

Multiparticle simulation of Accelerator System
INFN Laboratori Nazionali di Legnaro

“The SPES Project requires multi-particle simulation of very high number of different accelerator setups. This requires high computing powers. The cloud permits to distribute the computational effort reducing the total time from days to hours.

The Code TraceWin is used in client server mode with distributed runs on more than 1000 VCPUs."


Dott. Michele Comunian



Simulazioni particellari di terreni granulari
Dipartimento di Ingegneria Civile Edile ed Ambientale

“Nell'ambito del progetto europeo ITN2015 INFRASTAR,Geotechlab usa CloudVeneto per eseguire simulazioni particellari di terreni granulari. In particolare sfrutta le risorse disponibili per eseguire in batch prove triassiali cicliche su campioni di terreno virtuali per modellare fenomeni di ratcheting cioè di accumulo di deformazioni irreversibili. Questi modelli hanno lo scopo di comprendere come si modifica il comportamento meccanico del terreno dopo milioni di cicli di carico e scarico e trovano applicazione nel dimensionamento a lungo termine di strutture come fondazioni di turbine eoliche o fondazioni di infrastrutture stradali.

Le potenzialità di questa cloud sono l’allocazione di grandi risorse di calcolo tarate sulle necessità computazionali del modello, la possibilità di lanciare più macchine virtuali da remoto e di poter disporre di grandi volumi dove poter allocare i file di output delle simulazioni.”

PhD candidate Gianluca Zorzi e dott. Fabio Gabrieli


Fisica dei sistemi a molti corpi
Dipartimento di Fisica e Astronomia

“Abbiamo usato programmi fortran, da noi scritti, per calcolare tavole (=database) di coefficienti da utilizzare in calcoli di fisica dei sistemi a molti corpi, in particolare per sistemi nucleari composti da pochi nucleoni o nuclei a clusters.

Per ora ci siamo limitati ad un modello 1D, ottenendo risultati di benchmark che sono in via di pubblicazione e i calcoli sono stati relativamente poco onerosi, ma con il perfezionamento della versione 3D del codice avremo uno strumento potente per fare calcoli di struttura nucleare e verificare numerose ipotesi teoriche.

Sarà possibile anche estendere l'ambito di applicazione a sistemi atomici e molecolari, ampliando l'interdisciplinarietà del progetto.

L'utilizzo del cloud si è rivelato utile per distribuire i calcoli.”

Prof. Lorenzo Fortunato


Designing of gold nanostructure
Dipartimento di Scienze Chimiche

“During last decades nanotechnology grew widely on several fields from energy to medicine.

Nowadays, the so called nanobiotechnology and nanomedicine are opening new horizons on diseases monitoring and personalized therapies. Scaling down noble metals into nanometric structures produces interesting and, sometimes, unexpected properties that are not effective on the macrometric scale.

The case of gold nanostructure is one of the most studied because of their characteristic chemical inertia that prevents undesirable side effects into the hosting organism. At the same time, these nanostructures can be tuned to interact strongly with infrared light, that is considered a safe and useful source for diagnosis and drugs-free therapies.

The advent of high performing computational tools completely revolutionized the way in which such nanostructures are designed and produced. Simulating the interaction between complex nanostructures between each other and light helps the synthesis of materials with optimized performances. Our research projects are involved in computationally designing and then producing gold nanostructure as efficient sensors for diagnosis and for drug-free therapy. We are using the CloudVeneto resources for such use case”

Prof. Moreno Meneghetti


Analisi di dati di RNAseq differenziali e mappatura su pathway
Dipartimento di Medicina Molecolare

“Abbiamo in essere una piattaforma ospitata sul cloud. L'installazione non è stata problematica ed il servizio pubblicato su bioinformatics sta procedendo bene e si rivolge alla comunità scientifica interessata ad analisi di dati di RNAseq differenziali e mappatura su pathway.”

Prof. Stefano Toppo


Finite Element simulations on cracking due to drying
Dipartimento di Ingegneria Civile Edile ed Ambientale

“We are currently using CloudVeneto to run Finite Element simulations on cracking due to drying using the poromechanical and the phase-field formulation. Basically we use Ubuntu system and install the deal.II open source software.

The flexible structure of the Cloud allows us to create ourselves virtual machines and install the open source libraries we need. The access is straightforward and the support is very helpful when help is needed. Currently we are using the largest vm to run some tests on desiccation using the phase-field approach.”

PhD candidate Tuanny Cajuhi and Prof. Laura de Lorensis (University of Technology in Braunschweig)
and Prof. Lorenzo Sanavia


Simulazione del processo di riconoscimento tra composti chimici e proteine bersaglio
Dipartimento di Scienze del Farmaco

“Il progetto che stiamo portando avanti utilizzando la piattaforma CloudVeneto consiste nella simulazione del processo di riconoscimento tra composti chimici e proteine bersaglio mediante un approccio di docking molecolare. In questo momento, presso il nostro laboratorio (MMS) abbiamo archiviato virtualmente una libreria chimica di circa 5 milioni di composti di uso corrente nello screening per l'identificazione di nuovi candidati farmaci. L' archivio, chiamato MMsINC, è di pubblico dominio.

Durante la simulazione di docking molecolare per ogni proteina bersaglio selezionata vengono poi prodotti solitamente 5 plausibili complessi ligando-proteina per un totale massimo quindi di circa 25 milioni di complessi per caso di studio. Nel nostro laboratorio questa campagna di screening viene gestita attraverso la distribuendo dei vari processi.

Stiamo inoltre programmando di attivare un servizio web, che abbiamo già battezzato MMSDockCloud, che servirà da portale di accesso al servizio di calcolo descritto precedentemente.”

Prof. Stefano Moro


Critical Assessment of Functional Annotation
Dipartimento di Scienze Biomediche

“Questo progetto rientra in una competizione internazionale (CAFA). Il dataset di input è composto da 130 mila sequenze proteiche ignote. L'obiettivo è di predire le caratteristiche funzionali di ciascuna di esse nella maniera più accurata possibile.

E` dimostrato che proteine con sequenze aminoacidiche simili condividono struttura molecolare e dunque funzione biologica. La strategia utilizzata implica la ricerca di sequenze simili a quelle incognite in banche dati e il successivo trasferimento di annotazione. Per farlo si utilizzano software di allineamento locale ottimizzati per la ricerca rapida in database e si trasferisce l'annotazione funzionale sulla base della similarità di sequenza.

La piattaforma CloudVeneto ha permesso di ottimizzare tale processo di ricerca parallelizzando il carico di lavoro sulle risorse disponibili.”

Dott. Ivan Mičetić


Sviluppo di software di analisi dati per i grandi telescopi LST di CTA
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

"CTA è un nuovo progetto per l'astrofisica particellare.
Il gruppo di Padova è coinvolto nella realizzazione dei grandi telescopi LST (Large Sized Telescopes): oltre alla realizzazione di elementi del telescopio, Padova è responsabile insieme al gruppo di Barcellona, della messa a punto del software di analisi dati.
Il primo telescopio è stato inaugurato di recente nelle Canarie, Isola de La Palma: attraverso le risorse di CloudVeneto stiamo ora preparando gli strumenti per la ricostruzione degli eventi che consiste per il momento nella simulazione di come il telescopio osserva le cascate atmosferiche e nella definizione della strategia per la determinazione della direzione ed energia del raggio gamma che incide sull'atmosfera.
A breve, quando saranno disponibili i dati sperimentale, utilizzeremo le risorse di CloudVeneto anche per l'analisi dei primi dati scientifici."


Dr. Rubèn Lopez Coto


Blast (allineamenti di sequenza) di genomi di piante
Dipartimento di Scienze Biomediche

“In questo progetto si è cercato di studiare la similarità di sequenza all'interno di una banca dati di sequenze proteiche di piante generate da una collaborazione con l'istituto E. Mach di San Michele all'Adige. La banca dati è composta da circa 300 mila sequenze. I proteomi di piante studiati provengono da piante di interesse commerciale, come il melo, la fragola, il caffè e altre.

In questo progetto si sono condotti studi di autoallineamento delle sequenze della banca dati contro loro stesse al fine di generare cluster di sequenze proteiche con significato biologico simile.

La piattaforma CloudVeneto ha permesso di di parallelizzare questo task minimizzando il tempo di calcolo richiesto.”

Dott. Ivan Mičetić


Nuclear Reaction Dynamic's calculation using AMD code
INFN Laboratori Nazionali di Legnaro

"Antisymmetrized Molecular Dynamics (AMD) is a code for computing the evolution of Nuclear Reaction's dynamics by naturally including the structure of the interacting particles and the particle-particle correlations.
It is based on a stochastic equation of motion for the Gaussian wave-packets representing the colliding nucleons; the model treats the time development of the wave function and it can describe quantum mechanical features such as shell effects and clustering effects if any.

The NUCLEX collaboration is exploiting the CloudVeneto infrastructure where a cluster of virtual machines has been instantiated. Parallel processing is implemented natively in the AMD code by means of OpenMPI. This cluster configuration allows us to dramatically reduce the computation time to 5-7 days for 50k events (instead of few months on our single server)."


Dott. Tommaso Marchi, Dott. Magda Cicerchia


Disorder prediction over large databases
Dipartimento di Scienze Biomediche

“Il laboratorio di biologia computazionale del dipartimento di Scienze Biomediche ha realizzato e mantiene una risorsa che fornisce annotazioni strutturali circa regioni flessibili in sequenze proteiche (chiamate regioni disordinate). La banca dati comprende 80 milioni di sequenze.

Attualmente, è in corso l'aggiornamento della risorsa e le annotazioni vengono ricalcolate su versioni più recenti ed estese di tutte le sequenze proteiche di dominio pubblico. Tale dataset è composto da oltre 130 milioni di sequenze.

La piattaforma CloudVeneto viene utilizzata per parallelizzare la pipeline di annotazione risparmiando notevolmente in tempo di calcolo e favorendo un ciclo di rilascio più veloce.”

Dott. Ivan Mičetić


Esperimento CMS: Misure di precisione e ricerche di nuova fisica in collisioni protone protone al collisore LHC
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

"L'esperimento CMS (Compact Muon Solenoid) si occupa di rivelare le particelle prodotte nelle collisioni tra protoni prodotte dal Large Hadron Collider del CERN, con lo scopo di realizzare una vasta campagna di misure. Tra queste spiccano ad esempio le ricerche di “nuove” particelle, come accaduto con la scoperta del bosone di Higgs, o le misure di precisione di proprietà fondamentali della natura come nel caso della misura di asimmetrie particella-antiparticella.
Il gruppo CMS del dipartimento di Fisica e Astronomia di Padova e della sezione INFN di Padova e` attivo su molti di questi studi, basati sull’analisi delle grandi moli di dati raccolti dai sensori del rivelatore.

Per la ricostruzione e la successiva analisi di questi dati si rende necessario l’utilizzo di strumenti di calcolo in grado di affrontare compiti computazionalmente intensi, quali ad esempio la simulazione delle numerose interazioni tra le particelle e la risposta del rivelatore, la ricostruzione di eventi con topologie altamente complesse, l’analisi statistica per la stima di intervalli di confidenza o lo sviluppo di classificatori basati su reti neurali per la discriminazione di possibili segnali dal fondo atteso da processi noti nel detector.

A tal fine si fa largamente uso delle risorse messe a disposizione dell’infrastruttura CloudVeneto attraverso cluster dedicati, inclusa la creazione di cluster con allocazione “elastica” delle risorse, per l’utilizzo del software di ricostruzione dell’esperimento (CMSSW, basato su linguaggi python e C++) e ambienti di sviluppo di algoritmi multivariati, quali TMVA, TensorFlow e Theano."


Dott. Jacopo Pazzini


Analisi bootstrap per validazione del codice
Dipartimento di Scienze Biomediche

“Per la validazione di BOOGIE2, il software per la predizione dei gruppi sanguigni da dati genetici, è stata predisposta una piattaforma per l'analisi bootstrap per generare 10.000 pazienti virtuali sui quali testare il suddetto codice.

CloudVeneto e` stata utilizzata a tale scopo”

Dott. Ivan Mičetić


Analisi dati di immagini dei telescopi Cherenkov mediante applicazione di intelligenza artificiale con reti neurali convoluzionali.
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

"Le immagini delle cascate atmosferiche prodotte da raggi cosmici e raggi gamma catturate dai telescopi Cherenkov si prestano piuttosto bene per essere analizzate da un'intelligenza artificiale allo scopo di:
  1. classificare un evento come originato da un raggio gamma o da un protone (o nucleo più pesante)
  2. determinare energia più probabile del raggio gamma primario
  3. determinare con buona precisione la direzione del raggio gamma primario

Sono allo studio alcune metodologie di deep learning, in particolare reti convoluzionali che vengono allenate su campioni simulati le cui prestazioni verranno confrontate con metodi di analisi analisi più tradizionali. Il vantaggio dell'approccio "deep learning" è poter effettuare anche ricerche di eventi rari e particolari come multipli raggi gamma (condensati bosonici) oppure immagini di sciami prodotti da "nuclei pesanti" nei raggi cosmici, difficilmente classificabili con metodi analitici."


Dr. Rubèn Lopez Coto


Studio della produzione del quark beauty nelle collisioni protone protone al collisore LHC
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

“Il gruppo LHCb del DFA G. Galilei e della Sezione di Padova dell’INFN è impegnato nello studio della produzione del quark beauty nelle collisioni protone protone al collisore LHC.
I quark beauty vengono identificati tramite la ricostruzione esclusiva di mesoni e barioni contenenti appunto il quark beauty, come ad esempio i mesoni neutri Bs, oppure inclusivamente: identificando i jet prodotti dall’adronizzazione di un quark beauty. Entrambe le tecniche richiedono sofisticati algoritmi di boosted decision trees o di deep neural network.

Dopo essere stati messi a punto, questi algoritmi devono essere applicati a una notevole mole di eventi per isolare il segnale di interesse fisico. Per tutte queste operazioni, che richiedono ingenti risorse di calcolo, nonché per l’archiviazione dei dati, vengono intensivamente usate le risorse di CloudVeneto."


Dott. Alessandro Bertolin


Predizione della predisposizione all'obesità
Dipartimento di Scienze Biomediche

“Utilizzando i dati genomici del progetto Personal Genome Project, su CloudVeneto abbiamo testato e ottimizzato diversi classificatori (SVM e random forest con relativi parametri) con lo scopo di predire l'indice di massa corporea e di conseguenza la predisposizione all'obesità.”

Dott. Ivan Mičetić


Post-processing e l'analisi dei dati provenienti da un generatore di numeri casuali quantistici
Dipartimento di Ingegneria dell’Informazione

“Il gruppo QuantumFuture al DEI, ha utilizzato CloudVeneto per un progetto che riguarda un generatore di numeri casuali quantistici a rate di decine di Gbps.

Su CloudVeneto è stato effettuato il post-processing e l'analisi dei dati provenienti dal generatore fisico.

Abbiamo apprezzato l’avere totale controllo delle risorse, e la possibilità di gestire dinamicamente il numero di macchine e le risorse.”

Dott. Marco Avesani


Sviluppo di sistemi innovativi per l’analisi e l’acquisizione dati con tecniche “Big data" per l'esperimento CMS
INFN Sezione di Padova e Dipartimento di Fisica e Astronomia

"L’esperimento CMS (Compact Muon Solenoid) al CERN studia gli esiti delle collisioni protone-protone prodotte dal Large Hadron Collider: dovendo affrontare ogni 25 ns l’analisi dei segnali provenienti dai più di 70 milioni di canali di lettura del rivelatore, vengono prodotti ogni anno decine di PB di dati.
L’analisi di queste grandi moli di dati allo scopo di ricercare segnali rari e altamente elusivi richiede l’utilizzo intensivo di vaste risorse di calcolo, sia per la selezione e processamento dei dati raccolti “online” durante l’acquisizione, che nella successiva analisi dei dati “offline”.

Il gruppo CMS del dipartimento di Fisica e Astronomia di Padova, e della sezione INFN di Padova collabora con il CERN con l’obiettivo di ridefinire il paradigma del calcolo nelle analisi di fisica delle alte energie attraverso l’integrazione di tecnologie moderne per il processamento di grandi moli di dati, commercialmente diffuse sotto l’appellativo di Big Data. A tale scopo si impiegano infrastrutture software (Apache Spark, Apache Mesos, Kubernetes) che permettono di ottimizzare l’utilizzo delle risorse di calcolo a disposizione, realizzando una riduzione di diversi ordini di grandezza nel tempo di processamento dei dati.
Il gruppo è inoltre impegnato nello sviluppo di tecniche innovative per l’acquisizione e il processamento in tempo reale (online) dell’enorme quantità di segnali provenienti direttamente dai sensori degli esperimenti attraverso l’integrazione sistemi software capaci di realizzare lo streaming veloce dei dati (basati su Apache Kafka) verso cluster per il calcolo basati su Apache Spark.

Le risorse dell’infrastruttura CloudVeneto sono utilizzate in entrambe queste attività attraverso la creazione di cluster Apache Spark/Mesos e Kubernetes dedicati."


Dott. Jacopo Pazzini


Simulazione dell’interazione di fasci laser con materiale vetroso
Dipartimento di Ingegneria dell’Informazione

“Il gruppo QuantumFuture al DEI ha utilizzato CloudVeneto per lo studio e simulazione dell'interazione di fasci laser ad alta potenza nella banda a 10 micron con materiale vetroso per ottimizzare il processo di foratura di fialette di vetro per usi medici.”

Dott. Marco Avesani