A medida que empiece a explorar el mundo del diseño web, sin duda se le presentarán una serie de palabras y frases que son nuevas para usted. Uno de los términos que probablemente escuchará es «markup» o quizás «lenguaje de markup». ¿En qué se diferencia el «markup» del «código» y por qué algunos profesionales de la web parecen utilizar estos términos indistintamente? Empecemos por echar un vistazo a lo que es exactamente un «lenguaje de marcado».
Índice de contenidos
Veamos 3 idiomas de marcado
Casi todas las siglas en la Web que tienen un «ML» en él son un «lenguaje de marcado» (gran sorpresa, eso es lo que significa el «ML»). Los lenguajes de marcado son los bloques de construcción utilizados para crear páginas web o todas las formas y tamaños.
En realidad, hay muchos lenguajes de marcado diferentes en el mundo. Para el diseño y desarrollo web, hay tres lenguajes de marcado específicos con los que probablemente se encontrará. Estos son HTML, XML y XHTML.
¿Qué es un lenguaje de marcado?
Para definir correctamente este término – un lenguaje de marcado es un lenguaje que anota el texto para que la computadora pueda manipularlo. La mayoría de los lenguajes de marcado son legibles para el ser humano porque las anotaciones están escritas de tal manera que se distinguen del texto mismo. Por ejemplo, con HTML, XML y XHTML, las etiquetas de marcado son < y>. Cualquier texto que aparezca dentro de uno de esos caracteres se considera parte del lenguaje de marcado y no parte del texto anotado. Por ejemplo:
Este es un párrafo de texto escrito en HTML
Este ejemplo es un párrafo HTML. Se compone de una etiqueta de apertura (open tag), una etiqueta de cierre (closing tag) y el texto que se mostrará en pantalla (es el texto que se encuentra entre las dos etiquetas). Cada etiqueta incluye un símbolo «menos que» y «grande que» para designarla como parte del marcado.
Cuando formatea el texto para que se muestre en la pantalla de un ordenador u otro dispositivo, debe distinguir entre el texto en sí y las instrucciones del texto. El «marcado» son las instrucciones para visualizar o imprimir el texto.
El marcado no tiene que ser legible por computadora. Las anotaciones hechas en forma impresa o en un libro también se consideran marcado. Por ejemplo, muchos estudiantes en la escuela destacarán ciertas frases en sus libros de texto. Esto indica que el texto resaltado es más importante que el texto circundante. El color de realce se considera marcado.
El marcado se convierte en un lenguaje cuando se codifican las reglas sobre cómo escribir y usar ese marcado. Ese mismo estudiante podría tener su propio «lenguaje para tomar notas» si codificara reglas como «el marcador morado es para las definiciones, el amarillo es para los detalles del examen, y las notas de lápiz en los márgenes son para recursos adicionales».
La mayoría de los lenguajes de marcado son definidos por una autoridad externa para su uso por muchas personas diferentes. Así es como funcionan los lenguajes de marcado para la Web. Están definidos por el W3C, o World Wide Web Consortium.
Lenguaje de marcado HTML-HyperText
HTML o HyperText Markup Language es el idioma principal de la Web y el más común con el que trabajará como diseñador/desarrollador web. De hecho, puede ser el único lenguaje de marcado que utiliza en su trabajo.
Todas las páginas web están escritas en HTML. HTML define la forma en que las imágenes, los multimedia y el texto se muestran en los navegadores web. Este lenguaje incluye elementos para conectar sus documentos (hipertexto) y hacer que sus documentos web sean interactivos (como los formularios). Mucha gente llama HTML «código web», pero en realidad es sólo un lenguaje de marcado. Ninguno de los dos términos es estrictamente incorrecto y usted escuchará a la gente, incluyendo a los profesionales de la web, usar estos dos términos indistintamente.
HTML es un lenguaje de marcado estándar definido. Se basa en SGML (Standard Generalized Markup Language). Es un lenguaje que utiliza etiquetas para definir la estructura del texto. Los elementos y las etiquetas están definidos por los caracteres < y>.
Aunque el HTML es, con mucho, el lenguaje de marcado más popular utilizado en la Web hoy en día, no es la única opción para el desarrollo web. A medida que se desarrollaba HTML, se complicaba cada vez más y las etiquetas de estilo y contenido se combinaban en un solo lenguaje. Finalmente, el W3C decidió que era necesario separar el estilo de una página web del contenido. Una etiqueta que define el contenido por sí sola permanecería en HTML mientras que las etiquetas que definen el estilo se desaprobaban en favor de CSS (Cascading Style Sheets).
La última versión numerada de HTML es HTML5. Esta versión agregó más características en HTML y eliminó parte del rigor impuesto por XHTML (más sobre ese lenguaje en breve).
La forma en que se libera HTML ha sido alterada con el aumento de HTML5. Hoy en día, se añaden nuevas características y cambios sin necesidad de una nueva versión numerada. La última versión del lenguaje se denomina simplemente «HTML».
Lenguaje de marcado extensible XML-eXtensible
El lenguaje de marcas extensible es el lenguaje en el que se basa otra versión de HTML. Al igual que HTML, XML también se basa en SGML. Es menos estricto que el SGML y más estricto que el HTML simple. XML proporciona la posibilidad de crear varios lenguajes diferentes.
XML es un lenguaje para escribir lenguajes de marcado. Por ejemplo, si está trabajando en genealogía, puede crear etiquetas usando XML para definir el padre, la madre, la hija y el hijo en su XML de la siguiente manera: . También hay varios lenguajes estandarizados ya creados con XML: MathML para definir matemáticas, SMIL para trabajar con multimedia, XHTML y muchos otros.
Lenguaje de marcado XHTML-eXtended HyperText
XHTML 1.0 es HTML 4.0 redefinido para cumplir con el estándar XML. XHTML ha sido reemplazado en el diseño web moderno con HTML5 y los cambios que se han producido desde entonces. Es poco probable que encuentre sitios más nuevos usando XHTML, pero si está trabajando en un sitio mucho más antiguo, es posible que aún encuentre XHTML en estado salvaje.
No hay muchas diferencias importantes entre HTML y XHTML, pero esto es lo que notará:
- XHTML está escrito en minúsculas. Mientras que las etiquetas HTML pueden escribirse en mayúsculas, minúsculas o minúsculas, para ser correctas, las etiquetas XHTML deben ser todas en minúsculas. (Nota – muchos profesionales de la web escriben HTML en minúsculas, aunque no sea un requisito técnico).
- Todos los elementos XHTML deben tener una etiqueta final. Elementos con una sola etiqueta, como por ejemplo y necesitan una barra oblicua de cierre (/) al final de la etiqueta: / >
- / >
- Todos los atributos deben ser citados en XHTML. Algunas personas eliminan las comillas alrededor de los atributos para ahorrar espacio, pero son necesarias para que el XHTML sea correcto.
- XHTML requiere que las etiquetas estén correctamente anidadas. Si abre un elemento en negrita y luego un elemento en cursiva, debe cerrar el elemento en cursiva antes de cerrar el elemento en negrita. (Nótese que ambos elementos han sido obsoletos porque son elementos visuales. HTML ahora utiliza y en lugar de estos dos)
- Los atributos HTML deben tener un nombre y un valor. Los atributos que son independientes en HTML también deben declararse con valores, por ejemplo, el atributo HR se escribiría noshade=»noshade».