Una de las partes más importantes de la metainformación de la página
son los metadatos, que permiten incluir cualquier información relevante
sobre la propia página.
La especificación oficial de HTML no define la lista de metadatos que
se pueden incluir, por lo que las páginas tienen libertad absoluta para
definir los metadatos que consideren adecuados. La etiqueta empleada
para la definición de los metadatos es
<meta>.
| Etiqueta |
<meta> |
| Atributos comunes |
internacionalización |
| Atributos propios |
name = "texto" - El nombre de la propiedad que se define (no existe una lista oficial de propiedades)
content = "texto" - El valor de la propiedad definida (no existe una lista de valores permitidos)
http-equiv = "texto" - En ocasiones, reemplaza al atributo “name” y lo emplean los servidores para adaptar sus respuestas al documento
scheme = "texto" - Indica el esquema que se debe emplear para interpretar el valor de la propiedad
|
| Tipo de elemento |
- |
| Descripción |
Permite definir el valor de los metadatos que forman la metainformación del documento |
Los metadatos habituales utilizan solamente los atributos
name y
content para definir el nombre y el valor del metadato:
<meta name="autor" content="Juan Pérez" />
No obstante, algunas etiquetas
<meta> muy utilizadas hacen uso del atributo
http-equiv.
Este atributo se utiliza para indicar que el valor establecido por este
metadato puede ser utilizado por el servidor al entregar la página al
navegador del usuario. El siguiente metadato indica al servidor que el
contenido de la página es código HTML y su codificación de caracteres es
UTF-8:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
El atributo
scheme no suele utilizarse, aunque permite
proporcionar información de contexto para que el navegador interprete
correctamente el valor del metadato. En el siguiente ejemplo, el
atributo
scheme indica al navegador que el valor del metadato hace referencia al código ISBN:
<meta scheme="ISBN" name="identificador" content="789-1392349610">
Aunque no existe una lista oficial con los metadatos que se pueden
definir, algunos de ellos se utilizan en tantas páginas que se han
convertido prácticamente en un estándar. A continuación se muestran los
metadatos más utilizados:
Definir el autor del documento:
<meta name="author" content="Juan Pérez" />
Definir el programa con el que se ha creado el documento:
<meta name="generator" content="WordPress 2.8.4" />
Definir la codificación de caracteres del documento:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
Definir el copyright del documento:
<meta name="copyright" content="librosweb.es" />
Definir el comportamiento de los buscadores:
<meta name="robots" content="index, follow" />
Definir las palabras clave que definen el contenido del documento:
<meta name="keywords" content="diseño, css, hojas de estilos, web, html" />
Definir una breve descripción del sitio:
<meta name="description" content="Artículos sobre diseño web, usabilidad y accesibilidad" />
La etiqueta que define la codificación de los caracteres (
http-equiv="Content-Type") se emplea prácticamente en todas las páginas y las etiquetas que definen la descripción (
description) y las palabras clave (
keywords) también son muy utilizadas.
UTF-8
UTF-8 (8-
bit Unicode Transformation Format) es un
formato de codificación de caracteres
Unicode
e
ISO 10646
utilizando símbolos de longitud variable. UTF-8 fue creado por
Robert C.
Pike y
Kenneth L. Thompson. Está definido como
estándar por la
RFC 3629
de la
Internet Engineering Task Force
(IETF). Actualmente es una de las tres posibilidades de codificación reconocidas
por Unicode y lenguajes web, o cuatro en
ISO 10646.
Sus características principales son:
-Es
capaz de representar cualquier carácter Unicode.
-Usa
símbolos de longitud variable (de 1 a 4 bytes por carácter Unicode).
-Incluye
la especificación
US-ASCII de 7 bits, por lo que cualquier mensaje ASCII se
representa sin cambios.
-Incluye
sincronía. Es posible determinar el inicio de cada símbolo sin reiniciar
la lectura desde el principio de la comunicación.
-No
superposición. Los conjuntos de valores que puede tomar cada byte de un
carácter multibyte, son disjuntos, por lo que no es posible confundirlos
entre sí.
Estas características lo hacen atractivo en la codificación
de correos electrónicos y páginas web. El IETF requiere que todos
los protocolos de Internet indiquen qué codificación utilizan para los textos y
que UTF-8 sea una de las codificaciones contempladas. El Internet Mail Consortium
(IMC) recomienda que todos los programas de correo electrónico sean capaces de
crear y mostrar mensajes codificados utilizando UTF-8.
W3C
El Consorcio World Wide Web (W3C) es una comunidad internacional donde las organizaciones Miembro
[ingles], personal
[ingles] a tiempo completo y el público en general trabajan conjuntamente para desarrollar estándares Web
[ingles]. Liderado por el inventor de la Web Tim Berners-Lee
[ingles] y el Director Ejecutivo (CEO) Jeffrey Jaffe
[ingles], la misión del W3C es guiar la Web hacia su máximo potencial.
XML
XML, siglas en inglés de
eXtensible Markup Language ('lenguaje de marcas extensible'), es un lenguaje de marcas desarrollado por el World Wide Web Consortium (W3C) utilizado para almacenar datos en forma legible. Deriva del lenguaje SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML
es a su vez un lenguaje definido por SGML) para estructurar documentos
grandes. A diferencia de otros lenguajes, XML da soporte a bases de
datos, siendo útil cuando varias aplicaciones deben comunicarse entre sí
o integrar información. (Bases de datos Silberschatz).
XML no ha nacido sólo para su aplicación para Internet,
sino que se propone como un estándar para el intercambio de información
estructurada entre diferentes plataformas. Se puede usar en bases de
datos, editores de texto, hojas de cálculo y casi cualquier cosa
imaginable.
XML es una tecnología
sencilla que tiene a su alrededor otras que la complementan y la hacen
mucho más grande y con unas posibilidades mucho mayores. Tiene un papel
muy importante en la actualidad ya que permite la compatibilidad entre
sistemas para compartir la información de una manera segura, fiable y
fácil.