Skip Navigation LinksHOME > Temi della ricerca integrata > Domande di conoscenza
 pagina visitata 4427 volte dal 27/04/2006  
TEMA: DOMANDE DI CONOSCENZA

Domande di conoscenza per il governo del territorio

ASSEGNISTA
Giovanni Borga

DOCENTI DI RIFERIMENTO:
Di Prinzio, Bianchin, docenti del gruppo "Filiera Sit"

Tutor interno: prof. Luigi Di Prinzio
Tutor scientifico: ing. Massimo Rumor

Nell'ottica di costituzione di un nuovo soggetto istituzionale con compiti legati alla gestione dell'informazione territoriale, il modulo della ricerca integrata relativo alle domande di conoscenza tratta nello specifico le probematiche connesse ai processi di monitoraggio della domanda informativa e alle possibilità di costituzione di "dataset tematici" integrati formati da dati da sensori e da giacimenti informativi, oltre all'esplorazione di tecniche basate sull'impiego dei DBMS per la definzione dei modelli di incrocio tra la domanda e l'offerta.

Strategia della ricerca

La strategia di sviluppo della ricerca prende spunto dall'obiettivo principale che è la classificazione della domanda di informazione. Il primo nodo da sciogliere risulta perciò essere l'analisi di "cosa si intende" per domanda informativa, sia per avere gli elementi per definirne un "modello" orientato alla sua strutturazione in una banca dati, sia per progettare le ricerche e i colloqui necessari alla sua rilevazione. Parallelamente è necessario uno "screening" iniziale "speditivo" per costituire un primo insieme di dati su attività di governo/gestione in atto, normative di riferimento e soggetti coinvolti, indispensabile per testare l'efficacia della base dati.
Dopo lo screening iniziale si possono quindi individuare gli elementi principali della domanda informativa, classificarli e registrarli all'interno della base dati ed effettuare alcune prime interrogazioni collegando i dati sull'offerta e controllandone gli incroci.
Contestualmente al "raffinamento" e perfezionamento dei modelli interpretativi e logici, la rilevazione della domanda deve essere integrata con indagini più sistematiche e con colloqui diretti ad un panel significativo di operatori pubblici e privati concentrando l'analisi in un'area geografica limitata per arrivare a coprire la maggior parte delle tematiche applicative.
Successivamente, sfruttando questi modelli, la ricerca entra nella fase di definizione di "pacchetti" tematici che, integrando dati da sensori e giacimenti informativi "complementari", permettono di derivare nuove importanti informazioni; i pacchetti così definiti o anche ri-definiti sulla base di altri criteri possono essere raffrontati con la mappatura della domanda informativa ottenendo un prospetto sinottico che ne evidenzi quanto la domanda stessa sia soddisfatta.
L'ultimo prodotto della ricerca riguarda l'ideazione di un sistema informativo che, messo a disposizione di una ipotetica agenzia per l'informazione territoriale e pubblicato sulla rete internet, consentirebbe di mantenere la conoscenza diretta del flusso che dalla produzione del dato territoriale porta al suo utilizzo. Uno strumento di questo tipo va alimentato da una costante attività di monitoraggio e, essendo consultabile dagli operatori che si occupano di governo del territorio, può fornire le informazioni necessarie affinché le attività specifiche di ognuno si avvalgano in maniera quanto più efficace possibile di quanto le tecnologie dell'informazione geografica e ambientale possono offrire.

Elementi salienti della ricerca

Un modello per classificare la domanda
Registrare la "domanda di informazione" con strumenti tecnologici come i sistemi DBMS prevede che ogni elemento introdotto nel sistema sia definito nella sua struttura, ovvero ne siano definite le caratteristiche costitutive. Come emerge da quanto già svolto della ricerca, i caratteri costitutivi della domanda informativa sono analoghi ad alcuni propri dell'offerta e sostanzialmente fanno capo a tre categorie:
* Caratteri semantici (per i contenuti);
* Caratteri spaziali (per la localizzazione e il grado di risoluzione spaziale)
* Caratteri temporali (per le questioni legate all'aggiornamento del dato)
Mentre per gli attributi spaziali e temporali esistono specifiche già consolidate (cfr. ISO - Metadata) per quanto riguarda la classificazione dei contenuti ci si scontra con un importante aspetto strettamente legato all'ambiente informatico: l'attributo semantico risulta essere il più importante attributo relazionale che lega domanda e offerta e va dunque pensato come insieme di "parole chiave" piuttosto che come descrizione libera. La soluzione più idonea risulta essere l'adozione di una lista finita di vocaboli come può essere un thesaurus. Dall'analisi condotta si sono ritrovati esempi di thesaurus per il territorio e per l'ambiente già in fase avanzata di definizione in diversi contesti soprattutto istituzionali, tra i quali è stato scelto "GEMET", thesaurus multilingue dell'agenzia europea per l'ambiente (EEA); esso è apparso il più interessante in particolare per l'esistenza di diversi sistemi interni di classificazioni e gerarchie che si possono rivelare molto utili in vista delle operazioni di definizione integrata dei "pacchetti" informativi.

Primo screening
Per testare l'efficacia dei modelli di classificazione scelti si è scelto di costituire un primo insieme di informazioni ottenuto con procedure di tipo speditivo, ovvero con procedure non sistematiche che consentano con poche risorse l'ottenimento di determinate informazioni. Questo primo insieme di dati va poi integrato con metodologie estensive e sistematiche che assicurano la copertura più ampia dell'analisi.
Per il primo screening si è dunque scelta una ricerca basata su due prodotti sviluppati in ambiente web: il "metadati" della provincia di Siena e quello della provincia di Treviso che in sostanza sono dei repertori sistematici di banche dati geografiche e non geografiche provvisti di un'interfaccia di consultazione in ambiente internet. Dai due "metadati" è stato possibile estrapolare un primo elenco di piani e strumenti di governo del territorio risalendo da questi ai quadri legislativi di riferimento e alla definizione della domanda informativa generata.
Per il quadro ottenuto sono previste una prima integrazione mediante analisi più sistematica per considerare le normative naturalmente rimaste fuori dallo screening iniziale e una seconda attuata mediante colloqui diretti ad operatori pubblici e privati opportunamente scelti mirata a registrare quella domanda di informazione non considerata dal sistema delle norme.

Le basi dati integrate
La base dati della "domanda di conoscenza" possiede alcuni "anelli" che la connettono a quelle dell'offerta di dati da sensori e dell'offerta costituita dai giacimenti informativi. Inoltre il thesaurus GEMET e alcune altri elementi del sistema vengono inseriti in un quarto database connesso ai primi tre costituendo sostanzialmente la parte "condivisa" della banca dati integrata.
Dalla banca dati dei sensori la lista delle applicazioni legate ad ogni sensore viene caratterizzata dal punto di vista semantico da una serie di "descrittori" estratti da GEMET, così come avviene per l'elenco "dataset" della base dati sui giacimenti nella quale il contenuto delle diverse risorse informative è descritto mediante lo stesso dizionario terminologico. Queste due liste (applicazioni e dataset) sono direttamente connesse alla base dati della domanda all'interno della quale ogni elemento analizzato (sia emerso da un testo di legge, sia espresso da un soggetto) dà origine ad una serie di "voci" classificate sempre utilizzando il set di vocaboli del GEMET.
Nella banca dati della domanda dunque vengono predisposte le interrogazioni per: 1) sfruttare i descrittori GEMET per incrociare domanda e offerta; 2) sfruttare il sistema di classificazione di GEMET per accorpare le risorse informative in "pacchetti" tematici e per orientati a particolari segmenti applicativi.

Temi aperti e criticità

La ricerca, pur strutturata in un percorso predefinito, porta inevitabilmente a scoprire nuove possibilità di approfondimento sui diversi aspetti trattati ma deve necessariamente giungere ad una conclusione. Rimangono per questo sul tavolo temi non sviluppati anche se di indiscutibile interesse.
Uno di questi è lo stesso impiego del thesaurus GEMET che risulta avere, pur essendo ricco e ben strutturato, limiti provenienti dalla traduzione, dalla mancanza di vocaboli piuttosto utilizzati e dalla discutibilità di alcune relazioni e classificazioni utilizzate.
Altre criticità emergono dalle diverse basi dati sviluppate a più mani che occorre connettere attraverso opportune relazioni e codifiche.
Altre ancora nascono da aspetti più intrinsecamente legati alle informazioni contenute della base dati ma non rientrano negli obiettivi di questo documento.

:: Stati di avanzamento ricerca -->