Nota: Esta documento está preparado para verse como presentación en proyección, y en pantalla, mediante Opera 7.5 (Pulsar F11). En breve habrá una versión de presentación para otros navegadores.

Recuperación, relación e inserción de metadatos en imágenes.

Una cámara digital.
Una cámara digital. Logotipo de SIDAR

Recuperación, relación e inserción de metadatos en imágenes.

Una cámara digital.

Motivación

La archiconocida frase: El poder de la web está en su universalidad. Que todo el mundo pueda acceder, a pesar de la discapacidad, es esencial. implica acercar, facilitar, el uso de la tecnología al público en general. Que la tencología no se quede en manos de unos pocos, que no sólo los técnicos o "tecnólogos" puedan manejarla, que las personas no dependan de ellos para ser autores en la Web.

La llamada "Web Semántica" tiene un potencial maravilloso, pero sólo si realmente puede ser usada, aplicada, comprendida, por todas las personas que desean ser autores en la Web.

El conocimiento compartido que implica la Web, no podrá beneficiarse de TODOS si sólo unos pocos tienen alcance a determinadas tecnologías.

Por tanto debemos buscar los medios de simplificar el uso de las tecnologías que permiten el desarrollo de la Web Semántica.

Ese es el objetivo y motivación de este estudio y de los proyectos propuestos: Acercar la tecnología de la descripción de imagen al usuario medio y al profesional de la imagen.

Motivación

Especificaciones existentes útiles para describir imágenes fijas

DC
El esquema Dublin Core [DC] es un esquema general para identificar obras originales, normalmente libros y artículos, pero también películas, pinturas o fotos. Contiene propiedades como el autor, editor, título, fecha de publicación y empresa editora. Está siendo desarrollado por la "Dublin Core Metadata Initiative" El esquema Dublin Core original puede encontrarse en: http://purl.org/dc/elements/1.1/. De este esquema se usa, para la descripción de fotografías, una versión restringida que utiliza, generalmente, las mismas propiedades, pero que se interpretan de forma distinta según los distintos esquemas que las incluyen. Por ejemplo, a continuación se presentan tal y como se describen y limitan en el esquema que utiliza RDFPic (http://www.w3.org/2000/PhotoRDF/dc-1-0):
title
una corta descripción de la foto. Ejemplo: María subida en "el elefante"
subject
una serie de palabras clave para describir la foto. Ver abajo el esquema de contenido con la lista de palabras clave. Ejemplo: retrato, paisaje
description
una descripción extensa de la foto. Ejemplo: María intenta trepar la roca de granito llamada "el elefante"
creator ("author/creator")
el fotógrafo, en forma de URL que puede además describirse con otros esquemas. Ejemplo: http://www.example.org/People/Bos
Publisher
la persona o institución que publica la foto, a menudo es la misma que el creador. Ejemplo: http://www.example.org/People/Bos
contributor
una persona que ha contribuido de alguna manera, por ejemplo, la persona que ha digitalizado la foto; puede ser una URL o un nombre.
date
la fecha y hora en que la foto fue tomada, de acuerdo con el formato ISO [ISOdate]. El año es obligatorio, todo lo demás puede omitirse: yyyy[-mm[-dd[Thh:mm[:ss[.sTZD]]]]]. La zona horaria por defecto es UTC. Ejemplo: 1999-10-01
type
siempre "image" (ver la Lista de Tipos de Recurso de Dublin Core)
format
siempre "image/jpeg"
identifier ("number")
un número para la foto que tiene sentido para el editor. No es la URL de la foto y no tiene que ser globalmente único. Ejemplo: 312
source
no usado.
language
no usado.
relation
identifica una serie: el evento o tema de una serie de fotografías. Puede ser una URL o un texto. Ejemplo: María en Le Sidobre.
coverage ("location")
la localización que se muestra en la foto. (Note que nosotros usamos sólo la "cobertura espacial" no la "cobertura temporal", ya que asumimos que una foto es una instantánea y por tanto el campo de fecha es suficiente.). Ejemplo: Le Sidobre (Laguna)
rights
declaración de derechos de autor, o la URL para ella. Ejemplo: http://www.example.org/People/Lafon/Copyright?1998

Pero, por ejemplo, en XMP, que veremos más adelante, la propiedad "Subject" de DC no está limitada de la misma manera que en el esquema que usa RDFPic, sino que admite frases e interpreta incluso las palabras clave introducidas de acuerdo con el esquema IPTC, como atributo de esa propiedad.

Technical Schema
El "Esquema técnico" fue creado específicamente para el proyecto RDFPic. Permite definir aspectos técnicos de la toma de la fotografía. Este esquema recoge datos técnicos sobre la foto y la cámara, tales como el tipo de cámara, el tipo de película, la fecha de revelado de la película, y el escáner y software usados para digitalizarla.:
camera
la marca y modelo de la cámara, o una URL de la cámara. En caso de usar ésta última, la URL identifica una cámara determinada, no todas las cámaras de ese modelo. Ejemplo: http://www.example.org/People/Lafon/FooCamera8000i
film
la marca y tipo de la película. En contraste con las propiedades de la cámara, aquí no se trata de un rollo de película determinado, sino que identifica todos los rollos de película de un mismo tipo. (Asumimos que todos los rollos de un mismo tipo son suficientemente similares, excepto por errores de fabricación, son intercambiables). El valor puede ser un texto o una URL que se describe en alguna otra parte. Como convención, una cámara digital puede considerarse como una película "digital". Ejemplo: Ilfoo HP5
lens
una definición de las lentes usadas, puede ser una URI que las describe, una URI que apunta a la cámara para las cámaras compactas, o sólo una descripción en texto. Ejemplo: FooLens AF:70-210
devel-date
fecha en la que la película fue revelada. La fecha debe tener la misma forma que para la propiedad fecha. Ejemplo: 1998-08-04

Este esquema recoge datos que cualquier aficionado a la fotografía puede conocer, pues no son demasiado técnicos y son básicos. Como veremos hay otros esquemas que recogen datos más complejos o más técnicos referidos a el momento de la toma de la fotografía y a las características de la cámara o dispositivos con los que se hizo la toma.

Content Schema
Este esquema también fue desarrollado específicamente para el proyecto RDFPic y limita los atributos de la propiedad "Subject" de DC.contiene las palabras clave que usamos en la propiedad "subject" del esquema Dublin Core. Esta propiedad debe contener tantas palabras clave como sean aplicables.
Portrait
La foto contiene un retrato de una persona.
Group-portrait
La foto contiene un retrato de un grupo de personas.
Landscape
La foto contiene un paisaje
Baby
La foto contiene un bebé.
Architecture
La foto contiene edificios interesantes.
Wedding
La foto contiene escenas de una boda.
Macro
La foto contiene una toma macro, un primer plano muy cercano que hace que algo parezca mayor de como se ve a simple vista.
Graphic
La foto contiene un patrón, textura o dibujo, que es interesante por sus cualidades gráficas abstractas.
Panorama
La foto contiene una panorámica de un paisaje.
Animal
La foto contiene un animal.

Como puede verse, es un esquema muy simple y limitado, que puede ser suficiente para un usuario medio pero no así para el profesional o técnico de cualquier profesión que requiera definir de manera más exacta los contenidos de una fotografía. Como veremos más adelante, existen ya otros esquemas y aplicaciones que permiten el uso de cualquier ontología para definir las palabras clave relacionadas con el contenido de una foto.

EXIF
Es un estándar para almacenar información intercambiable en archivos de imágen. Es el que usan la mayoría de las cámaras digitales para almacenar en las fotos la información técnica sobre la toma y las características de la cámara. La especificación EXIF ha sido desarrollada por JEITA, la Asociación Japonesa de Tecnologías Electrónicas y de la Inforamción. Esta especificación cubre datos como: tiempo de exposición, número f, distancia focal, fecha, modelo de la cámara, datos del flash, etc.
IPTC
IPTC significa "International Press Telecommunications Council", pero se suele hablar de "Encabezados IPTC" para referirse a los metadatos que se definen siguiendo la especificación IIM (Information Interchange Model) que fue creada por dicho Consejo en 1997 y que dejó paso a la especificación NewsML vigente hoy en día y de la que ya se trabaja en la versión 2. La IPTC ha creado también un vocabulario contolado para definir el "Subject" de una fotografía o una noticia: Subject Reference System (SRS). Este vocabulario, aunque controlado, no está definido para siempre sino que se va actualizando e incluso pueden hacerse propuestas para la inclusión de nuevos términos. Está traducido a varios idiomas. Al estar pensado para facilitar el intercambio de información entre agencias de noticias, aparte de los clásicos campos para indicar el autor, título, descripción y demás, ofrece la posibilidad de indicar palabras clave, información sobre el editor e información más exacta sobre derechos de copyright, urgencia, etc.
XMP
Se trata de un estándar abierto de reciente creación, que tiene por finalidad facilitar la inclusión y recuperación de metadatos en publicaciones. Para las fotografías se usan tres esquemas específicos de XMP (XMP Basic Schema, XMP Rights Managemente Schema y XMP Media Managemente Schema) y además los otros esquemas que integra: DC, Photshop Schema (Que tiene las mismas propiedades del llamado IPTC), y EXIF Schemas. Quizás lo más interesante es que pueden incluirse paquetes XMP en formatos gráficos de tipo .png, .gif, .tif, .psd, .eps y .svg; además de, por supuesto, .jpeg.
DIG35
Pretende ser un estándar de definición de metadatos para imágenes digitales que pueda implementarse en distintos formatos, ser interpretado por distintos dispositivos y programas. La especificación ha sido creada por la I3a (International Imaging Industry Association) a la que pertenecen la mayoría, si no todas, las casas comerciales que se dedican a la fotografía. Pero en realidad no hay por el momento aplicaciones que utilicen su especificación, excepto el proyecto PMT
PRISM
Esta especificación se base en el estándar XML para metadatos usado para automatizar el proceso de flujo de trabajo lo que facilita la agregación, sindicación, personalización y postproducción de cualquier tipo de contenido para múltiples propósitos.
JPX o JPEG 2000
JPX está concebido como una extensión del formato JP2, el formato de JPEG 2000 que paulatinamente irá reemplazando al formato .jpg, y permite definir un contenedor para la imagen con ese formato y para los metadatos asociados a ella. La especificación de metadatos tiene su contrapartida a los definidos por Dublin Core y hay propuestas para que incluya también la definición mediante EXIF, GML (Geography Markup Language) e IMP
Pheed
Una extensión para la especificación RSS 2.0, que incluye algunos "elementos" específicos para la descripción de fotografías.
RDF
Es en realidad un metalenguaje, un marco de descripción de recursos que puede aplicarse a cualquier dominio. Se utiliza como lengua franca para estructurar y facilitar la recuperación de meta información definida por cualquier especificación o esquema.

Vocabularios

En este momento existen montones de vocabularios para describir casi cualquier cosa. En realidad se duplican muchas veces, pues cada cuál quiere crear "el" vocabulario. Algunos vocabularios especialmente interesantes para la descripción de personas que aparecen en fotografías son:

FOAF
Es un vocabulario para describir redes sociales, personas, organizaciones, etc. Por tanto, es útil para describir a las personas que aparecen en una fotografía y sus relaciones. El proyecto FOAF, va más allá del vocabulario básico y existen extensiones, herramientas, y listas de discusión, entre otras opciones de uso y participación en su evolución.
DPD
Un vocabulario experimental para describir fotos digitalizadas, creadas con una cámara digital o escaneadas, especialmente creado para distinguir los atributos de su forma original (cuando fue generada la imagen) de los que tiene al ser publicada. El vocabulario se encuentra en: http://kanzaki.com/ns/dpd
SVG Image Vocab
Un vocabulario creado por Jim Ley, especialmente para la descripción de zonas en fotografías mediante el uso de SVG.

Pero además hay vocabularios para describir la posición geográfica de los sujetos, o de los paisajes, y vocabularios para describir objetos, animales, partes del cuerpo, derechos reservados (como los de "Creativecommons", etc. Y desde distintas perspectivas, desde una perspectiva médica, artística, etc. Algunas aplicaciones permiten hacer búsquedas para localizar el vocabulario que mejor se adapte a nuestras necesidades, como por ejemplo el ya mencionado SMORE. Y existen también sitios Web en los que podemos buscar ontologías, como la Biblioteca de Ontologías DAML, el experimental "Wordnet", entre otros.

Y el hecho de la existencia de tantos vocabularios supuestamente útiles para describir fotografías, me lleva a preguntarme: ¿realmente existe "el" vocabulario capaz de satisfacer las necesidades de los diversos usuarios, que pueden ser fotógrafos ocasionales, aficionados o profesionales? ¿Es necesario o deseable que exista "el" vocabulario? Por el momento no tengo respuesta para estas preguntas, quizás más que un único vocabulario, lo que necesitaríamos es un sistema inteligente de recuperación de vocabularios. Bueno, un sistema inteligente y a la vez suficientemente sencillo para ser manejado por cualquiera. Algo que funcione más o menos como: Quiero describir tal cosa, y que el sistema me ofrezca el/los vocabularios más pertinentes para ello.

Especificaciones existentes útiles para describir imágenes fijas

Vocabularios

Metadatos insertados automáticamente en las imágenes

Existen medios para insertar directamente en las imágenes los metadatos que se quieran de acuerdo con las distintas especificaciones. Incluso en las fotografías tomadas con cármaras digitales se insertan automáticamente algunos metadatos de información técnica sobre la toma:

Metadatos insertados automáticamente en las imágenes

Insertar metadatos en fotografías

Existen numerosos scripts en lenguajes de programación que facilitan la insersión de metadatos en fotografías a ser publicadas en la Web, pero estos sólo son útiles para desarrolladores, por lo que el público en general, los autores Web que no son expertos en desarrollo, no conocen los sistemas operativos usados en lo servidores, ni lenguajes de programación, lo tienen difícil.

Están, por ejemplo:

Captive
Un script en PERL creado por Gerald Oskoboiny

Por otra parte, algunos de los programas de tratamiento de fotos permiten insertar metadatos en ellas. Pero la cantidad y calidad de la información que puede insertarse varía de un programa a otro, por ejemplo:

Paint Shop Pro
Recupera la información EXIF contenida en la foto y permite editar algunos campos de su información: Nombre del autor, copyright, comentario y título para la imagen.
Photo Studio
Aplicación para Windows que recupera la información EXIF (Es la única que se cita en las páginas de la especificación) y que permite añadir otros metadatos, como título, fecha y descripción. Además permite generar miniaturas y crear un álbum o presentación en HTML.
Photo Shop
La última versión, la 8 o CS, entiende las propiedades de varios esquemas: DC, EXIF, PDF, TIFF, XMP (por tanto también IPTC) y un esquema propio llamado Adobe Photoshop.
Pixvue
Una aplicación que se integra con el explorador de Windows y que permite añadir información a imágenes en formato .jpg o .tiff de acuerdo con las especificaciones EXIF, XMP e IPTC. También permite crear álbumes en formato HTML, que presentan parte de la información incrustada.

Insertar metadatos en fotografías

  • Existen numerosos scripts en lenguajes de programación que facilitan la insersión de metadatos en fotografías a ser publicadas en la Web, pero estos sólo son útiles para desarrolladores, por lo que el público en general, los autores Web que no son expertos en desarrollo, no conocen los sistemas operativos usados en lo servidores, ni lenguajes de programación, lo tienen difícil.
  • Por otra parte, algunos de los programas de tratamiento de fotos permiten insertar metadatos en ellas. Pero la cantidad y calidad de la información que puede insertarse varía de un programa a otro, por ejemplo:
    Paint Shop Pro
    Recupera la información EXIF contenida en la foto y permite editar algunos campos de su información: Nombre del autor, copyright, comentario y título para la imagen.
    Photo Studio
    Aplicación para Windows que recupera la información EXIF (Es la única que se cita en las páginas de la especificación) y que permite añadir otros metadatos, como título, fecha y descripción. Además permite generar miniaturas y crear un álbum o presentación en HTML.
  • Insertar metadatos en fotografías (II)

    Aplicaciones específicamente creadas para catalogar imágenes

    RDFPic
    Un programa en Java creado por miembros del W3C que permite insertar metadatos en fotografías y exportar los metadatos creados en formato rdf. El progra en sí funciona sobre cualquier plataforma, pero su desarrollo inicial se pensó para funcionar sobre un servidor Jigsaw, lo que dificulta su uso por parte del usuario medio.
    Kanzaki
    Una aplicación Web que convierte la información EXIF existente en una foto en RDF
    Image Info Toolkit
    Un programa especialmente creado para introducir metadatos según la especificación IPTC. Permite manejar múltiples ontologías (previo pago). Disponible para Windows y Mac.
    JAlbum
    Una aplicación multiplataforma para crear álbumes para la Web, que permite extraer la información y comentarios insertados en las propias fotos y, dependiendo de la "piel" que se elija (Ver: http://pipthepixie.tripod.com/blog/archive/2003_12_01_blog.html, Piel de Phil Wilson), generar nuevos metadatos relacionados con cada una y con el álbum completo.
    KimDaBa
    Una aplicación para Unix que genera una base de datos para imágenes.
    Rdfpic.py
    Roberto Antonio Ferreira De Almeida, ha creado un plugin para generar una galería de imágenes para Pyblosxom y que recupera la información insertada mediante RDFPic
    Aplicaciones creadas por Bert Bos
    Bert Bos ha creado varias aplicaciones en distintos lenguajes que facilitan la catalogación y publicación de fotografías en la Red.
    Galery
    Una aplicación XML para crear álbumes web de fotografías, relacionando alguna información en rdf.

    Existen otros programas útiles también para insertar o relacionar metadatos con fotografías, aunque su principal objetivo no sea ese, como por ejemplo: Progegé, Smore, MetadataMiner, KaliNews, etc.

    Aplicaciones específicamente creadas para catalogar imágenes

    Aplicaciones específicamente creadas para catalogar imágenes (II)

    Anotar imágenes y zonas en ellas

    Hay algunos desarrollos que permiten anotar fotografías y marcar zonas en ellas para describirlas mejor.

    Anotar imágenes y zonas en ellas

    Hay algunos desarrollos que permiten anotar fotografías y marcar zonas en ellas para describirlas mejor.

    Formas de presentación de la información

    Una vez que tenemos los metadatos incluidos o asociados con una fotografía y una aplicación Web capaz de recuperarlos. La cuestión es cómo presentarlos:

    Formas de presentación de la información

    Una vez que tenemos los metadatos incluidos o asociados con una fotografía y una aplicación Web capaz de recuperarlos. La cuestión es cómo presentarlos:

    Propuesta de proyectos

    Tras la investigación he iniciado los siguientes proyectos:

  • Dirigidos al público general
  • Dirigidos al profesional de la imagen
  • Propuestas de proyectos

  • Dirigidos al público general
  • Dirigidos al profesional de la imagen
  • RDFPic Extended

    Buscando información en la red sobre el rdfpic, por si había alguna actualización con mejoras, encontré una bitácora llamada bonjourlesmouettes, un "weblog", en la que una persona decía haber creado mejoras para él rdfpic, especialmente interesante me parecía la posibilidad de usar RDFPic en un servidor que no fuera el Jigsaw pues no todo el mundo tiene acceso a ese tipo de servidor.

    En el artículo se decía, se dice, que el llamado RDFPic Extended, funcionaba con PHP lo cuál es muy interesante pues hoy en día la mayoría, si no todos, los servidores utilizados por el usuario medio tienen la capacidad de utilizar PHP. Pero en la bitácora apenas se describen las mejoras o cambios aportados por RDFPic Extended, y no enconté ninguna información sobre cómo o dónde descargar la aplicación. Así que me puse en contacto con su creador: Vincent Tabard.

    Resultó que efectivamente, el RDFPic Extended existía pero sólo en el disco duro del ordenador de Vincent. De manera que nos pusimos a trabajar en ella. El desarrollo corre completamente a cargo de Vincent, mi aportación se centra en el concepto y en estimularle y en encontrar información que nos ayude a mejorar las capacidades de la aplicación, así como hacer pruebas en diversos servidores y hacer alguna aportación técnica de menor importancia.

    Concepción de RDFPic Extended

    La interacción entre PHP y RDF

    RDFPic Extended se apoya en algunas librerías de extensión de PHP, que le permiten utilizar documentos RDF XML:

    Esas extensiones son bastante comunes (la segunda esta instalada por defecto con PHP), entonces no limitan la implementación de RDFPic Extended y, en el caso en que no hubiera esas librerías, se pueden instalar muy fácilmente.

    Ficheros sobre el servidor vs. Base de datos

    Aunque las primeras versiones (alpha 1 y 2) de RDFPic Extended utilizaban el disco duro para salvar los documentos RDF, la tercera versión sólo utiliza una base de datos relacional (MySQL por el momento). ¿Porqué? Acceder a ficheros en un servidor de "producción" plantea enormes problemas de seguridad para los datos del sistema entero. Así, ciertos administradores no permiten utilizar las funciones de PHP para salvar datos (fopen(), fwrite()…). Entonces se decidió crear una base de datos para almacenar los triples sujeto-predicado-objeto. La estructura de la base no es exactamente la que se podría imaginar para representar datos RDF, pero fue construida sólo para reemplazar los ficheros. Tiene una estructura más rígida de lo que RDF permite, ya que por ejemplo no se pueden definir predicados diferentes de una imagen, pero eso permite una gestión simplificada para los administradores y una presentación "fija" más accesible para el usuario final.

    Ciclo de vida de una imagen

    1. Carga mediante HTTP POST por parte de un administrador.
    2. Extracción automática de los metadatos ya incluidos (EXIF, IPTC…) por RDFPic Extended.
    3. Verificación de esos datos por el usuario/administrador, que también puede añadir otros.
    4. ¡La imagen está lista para ser presentada a los usuarios!

    Metametadatos

    Se encuentran frecuentemente datos a propósito de metadatos. Se pueden citar los FOAF enlazados como "rdf:resource" en un campo "creator" del Dublín Core. Dos situaciones se presentan según el tipo de enlace:

    1. Enlace mail o hacía un recurso desconocido (pagina personal, weblog, foto…): RDFPic Extended lo pone automáticamente en enlace XHTML ().
    2. Enlace hacia un FOAF (Friend-Of-A-Friend): RDFPic Extended lo recupera y lo propone al usuario, presentado de manera similar a la de los metadatos de las fotos.

    La primera versión de RDFPic Extended

    La primera versión de RDFPic Extended, la que tenía Vincent funcionando en su ordenador, era una aplicación en PHP que permitía crear un álbum web y relacionar con cada fotografía los metadatos correspondientes de acuerdo con los esquemas definidos y utilizados por RDFPic original:

    Mejoras en las versiones intermedias del RDPic Extended

    La primera versión suponía utilizar la aplicación RDPic para incrustar los metadatos en la fotografía y RDFPic Extended se limitaba a leerlos y presentarlos en la Web.

    Esto suponía una gran limitación pues RDFPic es una aplicación en Java, que no todos los usuarios saben siquiera cómo ejecutar en su ordenador y, además, excluía la posibilidad de reconocer y presentar otros metadatos que podían existir en la fotografía o que el usuario podía añdir por otros medios.

    Nos interesaba que la aplicación fuera capaz de:

    La versión actual ( alphpa 3.x) de RDFPic Extended

    Por el momento, ofrece todo lo anterior, más:

    RDFPic Extended tiene su propia sede Web y en ella se ofrece la última versión disponible y la información más actúal sobre su evolución.

    Además, RDFPic Extended puede encontrarse en Sourceforge.net.

    Concepción de RDFPic Extended

    La interacción entre PHP y RDF

  • RDFPic Extended se apoya en algunas librerías de extensión de PHP, que le permiten utilizar documentos RDF XML:
  • Esas extensiones son bastante comunes (la segunda esta instalada por defecto con PHP), entonces no limitan la implementación de RDFPic Extended y, en el caso en que no hubiera esas librerías, se pueden instalar muy fácilmente.
  • Ficheros sobre el servidor vs. Base de datos

    Ciclo de vida de una imagen en RDFPic Extended

    1. Carga mediante HTTP POST por parte de un administrador.
    2. Extracción automática de los metadatos ya incluidos (EXIF, IPTC…) por RDFPic Extended.
    3. Verificación de esos datos por el usuario/administrador, que también puede añadir otros.
    4. ¡La imagen está lista para ser presentada a los usuarios!

    Metametadatos

    Evolución de RDFPic Extended

    La primera versión de RDFPic Extended, la que tenía Vincent funcionando en su ordenador, era una aplicación en PHP que permitía crear un álbum web y relacionar con cada fotografía los metadatos correspondientes de acuerdo con los esquemas definidos y utilizados por RDFPic original:

    Mejoras en las versiones intermedias del RDPic Extended

    Evolución de RDFPic Extended: Nuestro objetivo

    La versión actual ( alphpa 3.x) de RDFPic Extended

    Proyecto: Plantilla para Pixvue

    Vista de la presentación de datos EXIF en un álbum creado con Pixvue.

    Pixvue es una aplicación para Windows que se integra con el sistema operativo y funciona desde el propio explorador. Facilita la descripción de imágenes, utilizando las especificaciones EXIF, XMP e IPTC; incrustando la información definida en la propia imagen. Trabaja con los formatos .jpg y .tiff. Permite crear álbumes en HTML y para ello utiliza una plantilla XSLT, de manera que pueden crearse más plantillas que se acomoden a nuestras necesidades.

    El proyecto entonces consiste en la creación de una plantilla para esta aplicación, que presente todos los metadatos incrustados en las fotografías de manera clara y accesible.

    Proyecto: Plantilla para Pixvue

    Vista de la presentación de datos EXIF en un álbum creado con Pixvue.

    El proyecto para pixvue

    Proyecto: Piel para JAlbum

    Vista de un álbum creado con JAlbum.JAlbum es software libre y multiplataforma, que facilita la creación de álbume Web de fotografías. Dependiendo de la "piel" que se elija, se pueden relacionar y presentar metadatos de cada fotografía. Pero no existe ninguna piel que genere los álbumes cumpliendo con las directrices de accesibilidad y a la vez que permitan crear y mostrar los metadatos según todas las especificaciones existentes, de manera que el usuario pueda elegir aquella o aquellas que mejor se acomoden a sus necesidades.

    El proyecto JAlbum

    El proyecto entonces consiste en crear una piel para JAlbum que cumpla con las directrices de accesiblidad y permita elegir entre varias especificaciones de definición de metadatos.

    Proyecto: Piel para JAlbum

    El proyecto para JAlbum

    Necesidades profesionales de catalogación, descripción y recuperación

    Evidentemente no tiene las mismas necesidades un usuario cualquiera que quiere compartir y describir las fotografías de sus vacaciones familiares, que un profesional que necesita compartir o recuperar información de imágenes con contenido "profesional"

    Tomemos el caso de un biólogo: Podría necesitar describir partes de uno o varios elementos en una fotografía, cosa que en este momento puede hacerse utilizando, por ejemplo SMORE. Pero la recuperación de la información relacionada con una fotografía, por el momento es muy limitada.

    Pensemos en esas necesidades y las posibilidades que nos puede ofrecer el futuro: Un biólogo podría, por ejemplo, encontrarse en las selvas de Indonesia buscando nuevas especies de plantas o de animales, podría tomar una foto de lo que le parece una nueva especie, describir sus partes y "subirla" a Internet, donde podría haber un sistema de catalogación, búsqueda y reconocimiento de representaciones gráficas similares, de manera que pudiera arrojar como resultado si existe en el catálogo un ejemplar con similares características, basándose no sólo en la descripción textual hecha por el biólogo sino en el reconocimiento morfológico. ¿Quizás aplicando el Teorema de Bayes, algo del estilo del proyecto openbayes?.

    Un caso similar pero un tanto diferente, podría ser la necesidad de un etólogo de encontrar imágenes, fijas o en movimiento, de acciones, actitudes, en distintas especies. Para lo cuál sería necesario poder, no sólo describir los elementos en sí que aparecen en la imagen, ni sólo su relación con otros elementos, sino la acción o actitud de cada uno en el momento de la toma, y su interacción.

    Planteamiento inicial para un vocabulario de descripción de imágenes para profesionales de la imagen

    El caso de los profesionales de la imagen es especial, no sólo por la naturaleza de su profesión, sino porque encontraremos casos complejos de describir en sí mismos, pues importarán y se darán múltiples imágenes retóricas en cada una de las, valga la redundancia, imágenes que haya que describir, además de que se tendrá la necesidad de atender al lenguaje de la imagen y a aspectos esenciales para su comprensión que incumben sólo a esos profesionales y que pueden no aparecer físicamente en la fotografía (el "fuera de campo", por ejemplo).

    Otras cuestiones que serán de importancia para esos profesionales y que merecerá la pena incluir como metadatos serán aquellas referidas a la narrativa de la imagen. Sería el caso, por ejemplo, de la descripción de una imagen que se corresponde con el fotograma de una película, en la que interesará tener datos, referidos al personaje, aparte de los referidos al actor, como tiempo de permanencia en pantalla, duranción de sus diálogos, el diálogo en sí de la secuencia a la que pertenece el fotograma, etc.

    Casablanca: Un caso de estudio de necesidades profesionales

    Para esbozar, sólo esbozar, las posibles necesidades de catalogación, descripción y recuperación, que puede tener un profesional de la imagen, podemos tomar como caso un sitio en el que se presenta un estudio acerca de una película como Casablanca, por ejemplo.

    Aparte de la información básica de las fotografías, que sería la que cualquier persona consideraría de importancia, para el profesional de la imagen sería importante, e incluso necesaria, una información más precisa y generada desde las perspectivas de las teorías narrativa y de la imagen.

    Sería necesario entonces, tener la posibilidad de describir apropiadamente cuestiones como:

    Necesidades profesionales de catalogación, descripción y recuperación

    Un caso tipo: Biólogo

    Planteamiento inicial para un vocabulario de descripción de imágenes para profesionales de la imagen

  • El caso de los profesionales de la imagen es especial:
  • Casablanca: Un caso de estudio de necesidades profesionales

    Casablanca: Un caso de estudio de necesidades profesionales (II)

    Casablanca: Un caso de estudio de necesidades profesionales (III)

    Casablanca: Un caso de estudio de necesidades profesionales (IV)

    La imagen en movimiento

    La descripción de la imagen en movimiento, fílmica, videográfica o infográfica; tiene, naturalmente, una complejidad y unos requisitos distintos a la de la imagen fija.

    Existen en este momento distintos estudios y proyectos de descripción, catalogación y recuperación de elementos multimedia, entre ellos:

  • MIA

    Proyecto de sistematización del análisis de elementos multimedia

  • El proyecto Collate

    Un proyecto de anotación colaborativa para la preservación de la herencia cultural fílmica

  • La imagen en movimiento

    ¿Conclusión?

    Por lo que hemos visto, la conclusión es que aún queda mucho por hacer. Hay algunos avances pensados básicamente para "expertos", "técnicos", "desarrolladores"; pero es necesario trabajar más para acercar esta tecnología a los usuarios del mundo real: personas que simplemente quieren compartir sus cosas, sus intereses, sus sueños, sus ideales, con los demás y, personas que aunque profesionales de la imagen, no lo son de la informática y que se ven limitados a la hora de aprovechar en toda su capacidad lo que ofrece en la teoría y en la práctica la llamada Web Semántica.

    ¡Avancemos por este camino!

    ¿Conclusión?