MetaGETA: per estrarre, raccogliere, e trasformare metadati da dataset raster

26 giugno, 2011 | di Andrea Borruso in » Strumenti

In un dopocena di un po’ di tempo fa, speso in letture web su python e gdal, ho “guardato” un po’ dentro l’archivio di Google code, ed in particolare tra i progetti etichettati con “gdal”. Sono soltanto 17 e tra questi l’occhio mi è “caduto” su MetaGETA: Metadata Gathering, Extraction and Transformation Application.
Si tratta di un’applicazione scritta in python, per estrarre e raccogliere metadati da dataset raster spaziali, in uno di questi formati:

Generic format (che legge tutti i formati “classici” di GDAL, incluso GDAL Virtual Raster)
EO1 ALI (L1G & L1R) e Hyperion (L1R)
ACRES ALOS AVNIR-2/PRISM/PALSAR
ASTER
ACRES Landsat CCRS/SPOT 1-4
Digital Globe
ECW
ECWP
ENVI
ESRI Bil
ESRI GRIDs
ACRES Landsat FastL7A
JPEG2000
Landsat geotiff
NetCDF
NITF
SPOT 1-4
SPOT DIMAP

La scelta è molto ampia, con formati “generici” ed altri “specializzati” tipici del mondo del remote sensing. L’architettura a plugin dell’applicazione consente comunque di aggiungere facilmente nuovi driver di lettura di metadati.

E’ uno strumento di grande utilità, perché l’estrazione di metadati strutturati consente di conoscere meglio le proprie basi dati e di dargli quindi più valore.

Si tratta di un software opensource multipiattaforma, installabile da codice sorgente e nel caso di Windows anche tramite un installer. Io ho testato soltanto quest’ultima versione.
Il lancio si esegue (anche) da riga di comando con questa sintassi tipo:

>runcrawler.bat/sh arguments

Se non vengono forniti argomenti sufficienti, si aprirà la finestra di dialogo sottostante, in cui è possibile scegliere il percorso da analizzare, quello del file di output del processo, ed altre opzioni (tra cui quella di cercare anche nelle sottocartelle).

Gli output sono:

un file .xls con i metadati raccolti
la generazione (opzionale) di un’immagine di anteprima e di un thumbnail per ogni immagine dell’archivio
un quadro d’unione in formato ESRI Shapefile in coordinate geografiche (ma EPSG:4283, perché gli sviluppatori sono australiani, e gli piacciono i codici EPSG del paese loro), con in il bounding box di ogni immagine associato ai relativi metadati

Se volete un’idea dei contenuti del file .xls di output, potete fare click qui: le coordinate del bounding box, la risoluzione, il sistema di coordinate, il datatype, il tipo di compressione, le dimensioni, il numero di bande, ecc.. Ma ci sono anche campi tipici (come detto sopra) del remote sensing.

Ho invece pubblicato su GeoCommons uno shapefile di output di esempio. E’ il classico layer poligonale costituito dai bounding box degli strati informativi processati – analogo a quello di output di gdaltindex – arricchito dai metadati “intercettati” da MetaGETA.

Aggiunti nuovi file nel proprio archivio (e dopo un”eventuale rimozione di vecchi), possono essere eseguite nuove operazioni di indicizzazione che aggiorneranno i record del file .xls . Questo può essere facilmente convertito in XML secondo lo schema ANZLIC Profile (ISO 19139) e caricato ad esempio su GeoNetwork. E’ ancora una volta possibile personalizzare il processo, modificare lo schema di esportazione ed aggiungere anche nuovi campi.

MetaGETA però non fa miracoli e potrà estrarre soltanto i metadati associati ai vostri dati; in presenza di una “povera” coppia tif/tfw, non sarà in grado di determinarne il sistema di coordinate. Io l’ho trovato molto utile anche per questo: mi ha fatto scoprire diverse “falle” di alcune mie basi dati, ed evidenziato ancora una volta il grande valore del corredo informativo dei dati spaziali. Buon crawling!

Tag: metadata python raster remote sensing

Pensato e scritto da Andrea Borruso

Sono un geologo marino e nel 1999 ho iniziato con Antonio D'Argenio la vita da libero professionista nel mondo dei Sistemi Informativi Geografici. Nei primi anni - di tanto studio e di poche fatture - è stato fatale l’incontro con MapServer: il web-mapping e le applicazioni web sono diventati due pezzi importanti della mia professione. Negli ultimi anni mi sono occupato anche di formazione e di recente sono entrato nello strano mondo del telerilevamento di prossimità. Mi piace molto leggere di GIS, informazione geografica, e neogeography, e parlarne con gli amici che incontro spesso al bar dietro al router.

Attenzione! Questo è un articolo di almeno un anno fa!
I contenuti potrebbero non essere più adeguati ai tempi!

Commenti recenti
- Giovanni Allegri su I dati sismici di ISIDE adesso hanno un web service
- arfio su I dati sismici di ISIDE adesso hanno un web service
- Alessio su Non fare il bagno in Abruzzo! Lo dicono gli amici dei miei amici di Facebook!
- Elena84 su Non fare il bagno in Abruzzo! Lo dicono gli amici dei miei amici di Facebook!
- Andrea Borruso su GTFS, pronti, partenza, via …
Botti piccole

Spatialite sbarca su Android
Da oggi disponibile il porting di Spatialite per Android. Leggi tutto... (0)

Tante novità con PostGIS 2.0!
Annunciato il rilascio di PostGIS 2.0. Molte le novità di grande interesse. Leggi tutto... (0)

Lezioni online per spiegare scienza e tecnologia
Oilproject organizza con l’Istituto Italiano di Tecnologia una serie di lezioni divulgative su neuroscienze, nanotecnologie, farmacologia e macchine intelligenti, per raccontare al grande pubblico lo stato dell’arte della ricerca di base e applicata. Qui tutti i dettagli. Leggi tutto... (0)

Il GFOSS Day 2011 è a Foggia
I prossimi 24 e 25 novembre l’Università degli Studi di Foggia ospiterà il GFOSS DAY 2011, organizzato come di consueto dall’Associazione Italiana per l’Informazione Geografica Libera GFOSS.it Leggi tutto... (1)

Mappali, denunciali e... tassa.li
Tassa.li è una interessante startup realizzata da un gruppo di giovani tecnologi, con l’intento di rendere facile la denuncia di esercizi commerciali che non rilasciano il regolare scontrino fiscale. E in un periodo nero come questo, molta gente avrà una gran voglia di partecipare. Grazie a una applicazione disponibile sia per iOS che Android, è infatti possibile in pochi clic geotaggare l’esercizio e riportare la somma dello scontrino non emesso. Il tutto in maniera assolutamente anonima. E questi ragazzi dimostrano di vedere molto lontano, perché presto rilasceranno i dati raccolti in forma totalmente aperta e libera. (7)
Post recenti
Meta
Questa opera è pubblicata sotto una Licenza Creative Commons.

MetaGETA: per estrarre, raccogliere, e trasformare metadati da dataset raster

Lascia un commento

Categorie

PLANET GIS Italia

Amici

Blogroll

Gis e Archeologia

GIS related

Commenti recenti

Botti piccole

Post recenti

Meta