L'ubiquità degli spazi di archiviazione dei dati digitali e la facilità di acquisizione e generazione di nuovi dati, tramite smartphone, tablet, telecamere embedded, telecamere di sorveglianza fisse, sistemi di tracciamento di tipo GPS, una scheda Vitale, sistemi di imaging medico, ecc., consentono a tutti e agli enti pubblici di memorizzare una quantità fenomenale di dati, come testimoniano le biblioteche digitali caricate con foto e video personali, le informazioni memorizzate dai social network o i portali open data recentemente messi a disposizione dalle regioni e dallo Stato francese. Tipicamente i dati generati e memorizzati possono essere eterogenei e diversificati: ad esempio, possono riferirsi alle immagini dei polmoni di un paziente con una malattia, alle abitudini di acquisto dei clienti di un negozio, o al rinnovo delle marcature sulle strade del dipartimento Eure. L'insieme di questi dati costituisce una ricchezza che è necessario esplorare, pulire e interpretare per generare conoscenza. Come evidenziato anche nella relazione del 2011 di Mc Kinsey, questa capacità di estrarre le conoscenze dai dati sarà a brevissimo termine, e per molto tempo, un veicolo per l'innovazione e la ricchezza. Di conseguenza, le scoperte scientifiche ottenute attraverso l'analisi dei dati sono in aumento e sono coinvolte in diversi campi disciplinari come la biologia, la salute, le scienze umanistiche e le scienze sociali. ... In questo contesto, la scienza dei dati è la forza trainante di queste ricerche e innovazioni e le questioni scientifiche affrontate affrontano i problemi di acquisizione, stoccaggio, indicizzazione, modellizzazione e analisi. Tra le questioni difficili figurano l'integrazione di questi dati complessi, eterogenei e interdipendenti al fine di generare conoscenze, contribuire al processo decisionale o generare valore. La regione dell'Alta Normandia e tutti gli attori istituzionali della regione, pienamente consapevoli dell'importanza del settore digitale, moltiplicano le sue attività di sviluppo e il sostegno agli attori e agli imprenditori locali, generando o elaborando dati digitali; per esempio, la creazione della Senna Innopolis e la mensa digitale. Per sfruttare tali dati, è pertanto di fondamentale importanza avviare una strutturazione delle attività locali relative all'analisi dei dati e alla scienza. Il progetto che proponiamo è un'occasione unica per lanciare e federare attività intorno a questo tema.Il progetto DAISI mira a strutturare parte del lavoro svolto in data science e coinvolgendo vari attori di alto livello (vedi elenco di partner qui sotto). Il suo obiettivo è quello di unire i punti di forza e i mezzi acquisiti e implementati da questi attori al fine di rafforzare le competenze esistenti, di sviluppare nuovi campi di ricerca nati dalla fecondazione incrociata di particolari campi scientifici e della scienza dei dati, e infine di incoraggiare gli attori a produrre risultati scientifici di rilevanza internazionale dai loro aspetti innovativi. Dal punto di vista scientifico, il suo obiettivo è quello di sviluppare metodi e strumenti innovativi per analizzare grandi quantità di dati, per estrarre informazioni e conoscenze utili a diversi ambiti disciplinari come la salute, l'ambiente urbano e l'analisi del traffico urbano. Da questo punto di vista, il DAISI è pertanto un progetto di ricerca a monte guidato da applicazioni ad alto impatto sociale.