Nov 25, 2006

Ejercicios de creación de Metadatos Dublin Core

Mucha gente habla de Metadatos sin haber tenido nunca la oportunidad de verlos ni tocarlos, e incluso sin haber trabajado nunca con HTML. Lo primero que hay que entender es que se trata de un fenómeno que sólo tiene sentido en el mundo electrónico: Queremos dotar a un documento, sea él de texto, imagen, audio, video o lo que sea, de algo así como un "registro de base de datos" que lo acompañe siempre desde dentro de su propio archivo digital y que pueda ser leido por motores de búsqueda y otros programas. Es como el "chip" que le implantan a los perros para que puedan ser identificados con un lector de chips donde quiera que vayan.

Estos ejercicios le permitirán a usted visualizar las sucesivas transformaciones de formato que se producen desde un simple archivo de texto hasta tener un documento HTML con metadatos Dublin Core. Están dirigidos a personas que se preguntan para sus adentros: ¿Qué diablos será eso de metadatos, y porqué no es lo mismo que la catalogación tradicional?

Nota para los puristas: No entraremos en las complejidades del HTML 4 que es la versión actualmente en vigor de este lenguaje, ni pretendemos crear un documento XML con todos sus detalles, sino que, simplemente, concentrarnos en el proceso de transformación usando las herramientas mínimas necesarias para obtener un resultado.

Primer ejercicio: Crear un archivo HTML simple
  1. Con Bloc de Notas, cree un archivo de texto, vacío por ahora, llamado Sabina1.txt en su computadora.
  2. Copie el fragmento del poema de Sabina desde Homenaje-Sabina-4 al portapapeles, abra el archivo de texto Sabina1.txt con Bloc de Notas, pegue el poema y guárdelo.
  3. Con Bloc de Notas, cree un archivo HTML mínimo y llámelo Sabina1.htm
  4. Copie nuevamente el texto del poema, insértelo entre las indicaciones <body> y </body> del archivo Sabina1.htm y guárdelo.
  5. Abra Sabina1.htm con Internet Explorer, Firefox u otro navegador para ver el resultado.
Comentario:
Fíjese en la diferencia que hay entre ambos archivos, el .txt y el .htm: el primero contiene sólo el texto pelado, y sólo lo entiende un editor de texto, mientras que el segundo tiene los comandos necesarios para que lo pueda entender un navegador.

Si usted hiciera una copia del archivo de texto, por ejemplo, a Sabina1a.htm, y le hace un doble clic, el navegador obedientemente lo va a abrir, pero se quedará marcando ocupado buscando las etiquetas <html>, <head>, etc. y como no las encuentra, no podrá mostrar nada en la pantalla.

Segundo ejercicio: Agregar los Metadatos Dublin Core con ayuda de una planilla (template) o generador de metadatos
  1. Vaya a la página http://www.webposible.com/utilidades/dublincore-metadata-gen
  2. Llene todos los campos que estime adecuados y necesarios para la correcta identificación del archivo Sabina1.htm.
  3. Cuando haya terminado, clique el botón "Generar Metadatos"
  4. Verá una lista con los metadatos solicitados, correctamente formateados para un documento HTML simple.
  5. Copie toda la lista de metadatos al portapapeles.
  6. Abra Sabina1.htm con Bloc de Notas, posicione el cursor entre <head> y </head> y pegue los metadatos. Guarde el archivo.
  7. Abra Sabina1.htm con Internet Explorer o cualquier otro navegador y examine los resultados. Examine igualmente el código fuente. (¿No sabe cómo? Pregúntele a alguien cómo se puede ver el código fuente en su navegador)

Tercer ejercicio: Crear el archivo HTML a partir de MS Word

  1. Abra MS Word, copie el mismo fragmento del poema de Sabina y guárdelo en formato Word, como Sabina2.doc.
  2. Abra Sabina2.doc con Bloc de Notas y examine la cantidad de metadatos propios que el Word creó por su cuenta.
  3. Abra Sabina2.doc en Word y guárdelo en formato HTML sencillo, como Página Web Filtrada, Sabina2.htm.
  4. Abra Sabina2.htm con Bloc de Notas y examine en lo que Word convirtió sus metadatos propios.
  5. Piense: ¿Dónde va a intercalar los metadatos Dublin Core?


Moraleja: No se aconseja usar el MS Word como editor de HTML, porque incluye en el archivo toda la gama de estilos, formatos y tamaños de fuente que dispone, por si a alguien se le ocurriera en el futuro volver a convertirlo de .HTM a .DOC.
Un archivo HTML bien hecho, incluye solamente los comandos básicos necesarios para mostrar el documento en cuestión.


¿Qué es un archivo HTML mínimo?
Es un archivo de texto, con la extensión .HTM o .HTML, que contiene los siguientes elementos HTML mínimos:
<html>Abre el archivo HTML
<head>Abre la "cabeza" del archivo
<title>Aquí va el título que aparecerá en la barra azul del navegador</title>
Aquí van los metadatos, dentro de la "cabeza"
</head>Cierra la "cabeza"
<body>Abre el "cuerpo"
Aquí debe ir el texto del archivo
</body>Cierra el "cuerpo"
</html>Cierra el archivo HTML

En la práctica, habrá una serie de otros elementos también entre <head> y </head>, pero esto no es un curso para hacer páginas web, así que no nos preocupa por el momento.

No comments: