1. Metadatos: ¿Qué son y para qué sirven?

En RDF y metadatos http://www.xml.com/pub/a/98/06/rdf.html Tim Bray plantea varios escenarios:

  • Una biblioteca en la cual se buscan libros, por autor, título o materia

  • Una tienda de videos en la que buscamos una película de un director

  • Un directorio telefónico en el que queremos encontrar un sitio que haga entregas de pizza fuera de horario normal.

En estos casos hay un elemento común que son los metadatos, piezas de información que me ayudan a encontrar la información que busco –el libro, el video, el local de pizzas-. Estos metadatos no serán los mismos en los distintos escenarios, cada uno definirá su propio sistema.

La utilidad más palpable de los metadatos es su ayuda para encontrar recursos. Pero hay otros aspectos que registran los metadatos que tienen que ver con la administración o gestión de los recursos. Como la web es un sitio enorme que alberga libros, películas y locales de pizzas entre otras cosas el uso de los metadatos es fundamental.

Ícono del sitio web WikipediaDixit:

Metadatos (del griego μετα, meta, 'después de, más allá de' y latín datum, 'lo que se da', «dato» ), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

 María Jesús Lamarca Lapuente en su tesis doctoral Hipertexto: el nuevo concepto de documento en la cultura de la imagen asevera 1:

Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y clasificar los recursos presentes en la World Wide Web con el fin de facilitar la posterior búsqueda y recuperación de la información. Este mecanismo los constituyen los llamados metadatos.

En el curso sobre metadatos de la asociación española de documentación e información 2 se declara:

Ante el volumen y heterogeneidad de información existente en la World-Wide Web, las bibliotecas y unidades de información necesitan crear sistemas de organización y recuperación de información electrónica que proporcionen, a los usuarios profesionales, una alternativa a los motores de búsqueda y que permitan garantizar la calidad/fiabilidad del contenido. Así, distintas comunidades y dominios informativos que utilizan la web como soporte de sus conocimientos están desarrollando servicios de información de calidad basados en la estructuración de la información sobre la información (metadatos).

Mapa mundial y mapa de europa con campos de metadatos de ejemplo (Sistema de referencia, Título, Propósito, Punto de contacto, Calidad)

 En el geoportal de metadatos de Información geográfica - http://metadatos.ign.es/web/guest/inicio - que es un portal que recopila metadatos de recursos geográficos (mapas y geoservicios) en España figura:

Los metadatos, datos sobre los datos, son las descripciones de los datos (calidad, propietario, fecha de actualización, uso, formato, precios, etc.), que permiten a un productor de información geográfica describir las características del conjunto de datos que produce, y a un usuario utilizarlos adecuadamente. Por ejemplo, para una hoja de un Mapa Topográfico Nacional del Instituto Geográfico Nacional, a través de los metadatos se puede conocer la escala del mapa, en qué sistema de referencia se encuentra, qué organismo lo ha producido, qué fecha de creación tiene, etc. De tal modo que los metadatos dan respuestas a preguntas del tipo:

  • El cuándo: cuándo fue creado el conjunto de datos o el servicio, las distintas actualizaciones, si existen o la validez temporal que pudiera tener.

  • El cómo: cómo se obtuvieron y procesaron los datos y cómo se puede acceder a ellos.

  • El dónde: la zona o extensión geográfica que cubren los datos, basada en latitud/longitud, coordenadas x e y, o un área administrativa descrita por su nombre, resumen detallado de la finalidad, o propósito, para la que se ha generado el conjunto de datos o se ha creado el servicio.

Ahora bien, el concepto de metadatos se extiende no sólo a los datos, sino a todo tipo de recursos (servicios web, publicaciones, cursos,…). En el ámbito de la Información Geográfica, se hablará de metadatos para la descripción de los datos y para la descripción de los servicios web, por ejemplo: un servicio web de mapas (WMS) publicado debe ir acompañado de su fichero de metadatos y cada Modelo Digital del Terreno (MDT) debería ir acompañado de su fichero de metadatos.

Una vez que se han creado los ficheros de metadatos se ponen a disposición de los usuarios y la forma de hacerlos públicos de manera clara y ordenada es a través de "Catálogos".De este modo se pueden realizar consultas de metadatos procedentes de diferentes fuentes de información y, en general, se logra la interoperabilidad en los metadatos pero para ello es fundamental que los metadatos hayan sido generados conforma a una norma.

Los objetivos que se persigue con la creación de los metadatos son:

  • Dar publicidad a los productos existentes: a través de los catálogos de metadatos, las organizaciones pueden compartir sus datos y servicios.

  • Conocer las características de la información: los metadatos incluyen aquellas propiedades que permiten evaluar si la información geográfica satisface los requerimientos de un proyecto, de modo que se fomenta la reutilización de la información

  • Proporcionar información que ayude a su explotación: a través de los metadatos, se documenta información que permite la descarga, el acceso y su utilización de un modo más eficaz, favoreciéndose la interoperabilidad de la información cuando procede de diversas fuentes.

Dentro del contexto de un portal geográfico a nivel nacional (IDE Infraestructura Digital Espacial) los metadatos juegan un rol fundamental porque permiten que los usuarios, a través de los catálogos de metadatos, acceder a los conjuntos de datos y también a los servicios, para que se pueda acceder y explotar del modo más eficiente la información geográfica.

La Universidad de Cornell 1 señala que si bien se pueden establecer clasificaciones para los metadatos de acuerdo a tipos y funciones, estas clasificaciones pueden superponerse.

TIPO

OBJETIVO

Metadatos descriptivos

Descripción e identificación de recursos de información

  • en el nivel (sistema) local para permitir la búsqueda y la recuperación (por ejemplo, búsqueda de una colección de imágenes para encontrar pinturas con ilustraciones de animales);

  • en el nivel Web, permite a los usuarios descubrir recursos (por ejemplo, búsqueda en la Web para encontrar colecciones digitalizadas sobre poesía).

Metadatos estructurales

facilitan la navegación y presentación de recursos electrónicos

  • proporcionan información sobre la estructura interna de los recursos, incluyendo página, sección, capítulo, numeración, índices, y tabla de contenidos;

  • describen la relación entre los materiales (por ejemplo, la fotografía B fue incluida en el manuscrito A);

  • unen los archivos y los textos relacionados (por ejemplo, el ArchivoA es el formato JPEG de la imagen de archivo del ArchivoB).

Metadatos administrativos

facilitan la gestión y procesamiento de las colecciones digitales tanto a corto como a largo plazo

  • incluyen datos técnicos sobre la creación y el control de calidad;

  • incluyen gestión de derechos y requisitos de control de acceso y utilización;

  • información sobre acción de preservación.

Dentro de los metadatos algunos permanecerán estáticos, como por ejemplo la fecha de creación, mientras que otros sufrirán cambios como la fecha de actualización

Algunos metadatos necesitaran ingresos manuales mientras de otros se puede realizar una extracción automática, por ejemplo en bibliotecas de recursos digitales –v.g. Greenstone- la aplicación extrae metadatos y los sugiere estableciendo que son extraídos.

Los metadatos pueden estar en un archivo externo al recurso o pueden incrustarse en el mismo, un caso bien claro de metadatos incrustado son los metadatos exif que se incrustan en el propio archivo. Un ejemplo de metadatos EXIF (extraído de Wikipedia) de datos de una fotografía de una máquina digital típica.

Característica

Valor

Manufacturer

CASIO

Model

QV-4000

Orientation

top - left

Software

Ver1.01

Date and Time

2003:08:15 16:45:32

YCbCr Positioning

centered

Compression

JPEG compression

x-Resolution

72.00

y-Resolution

72.00

Resolution Unit

Inch

Exposure Time

1/659 s

FNumber

f/4.0

ExposureProgram

Normal program

Exif Versión

Exif Versión 2.1

Date and Time (original)

2003:08:15 16:45:32

Date and Time (digitized)

2003:08:15 16:45:32

ComponentsConfiguration

Y Cb Cr -

Compressed Bits per Pixel

4.01

Exposure Bias

0.0

MaxApertureValue

2.00

Metering Mode

Pattern

Flash

Flash did not fire.

Focal Length

20.1 mm

Maker Note

432 bytes unknown data

FlashPixVersion

FlashPix Versión 1.0

Color Space

sRGB

PixelXDimension

2240

PixelYDimension

1680

File Source

DSC