2 Introdución à HTML 4

Índice

  1. Que é a World Wide Web?
    1. Introdución aos URI
    2. Identificadores de fragmentos
    3. URI relativos
  2. Que é a HTML?
    1. Breve história da HTML
  3. HTML 4
    1. Internacionalización
    2. Acesibilidade
    3. Tabelas
    4. Documentos compostos
    5. Follas de estilo
    6. Scripts
    7. Impresión
  4. Creación de documentos con HTML 4
    1. Separar estrutura e apresentación
    2. Considerar a acesibilidade universal à Web
    3. Axudar aos axentes de usuário coa representación incremental

2.1 Que é a World Wide Web?

A World Wide Web (Web) , a "Rede Mundial", é unha rede de recursos de información. A Rede descansa sobre tres mecanismos que fan que eses recursos estexan inmediatamente disponíbeis para a maior audiéncia posíbel:

  1. Un esquema de nomes uniforme para localizar recursos na Rede (p.ex.: URI).
  2. Protocolos, para o aceso aos recursos con nome na Web (p.ex.: HTTP).
  3. Hipertexto, para a navegación doada entre recursos (p.ex.: HTML).

Os lazos entre os tres mecanismos fan-se evidentes ao longo desta especificación.

2.1.1 Introdución aos URI

Todo recurso disponíbel na Rede - documento en HTML, imaxe, video clip, programa, etc.- ten un enderezo que se pode codificar mediante un Identificador Universal de Recursos ( Universal Resource Identifier , "URI").

Os URI consisten normalmente de tres partes:

  1. O esquema de nomes do mecanismo usado para aceder ao recurso.
  2. O nome da máquina que hospeda o recurso.
  3. O nome do recurso mesmo, dado como unha rota ("path").

Considere o URI que designa a páxina de informes técnicos do W3C:

   http://www.w3.org/TR

Este URI pode-se ler da seguinte maneira: Hai un documento disponíbel através do protocolo HTTP (ver [RFC2616] ), que reside na máquina www.w3.org, acesíbel através da rota "/TR". Outros esquemas que se poden ver nos documentos HTML incluen "mailto" para o correo electrónico e "ftp" para FTP.

Velaqui outro exemplo dun URI. Este refere-se à caixa de correio dun usuário:

   ...aqui hai texto...
   Para calquer comentário, envie un correo a
   <A href="mailto:xose@unsitio.com">Xosé Calvo</A>.

Nota. A maioria dos leitores poden estar familiarizados co termo "URL" e non co termo "URI". Os URL forman un subconxunto do esquema de nomes máis xeral que os URI.

2.1.2 Identificadores de fragmentos

Alguns URI referen-se a unha localización dentro dun recurso. Este tipo de URI remata cun "#" seguido dun identificador de áncora (chamado identificador do fragmento ). Por exemplo, velaqui un URI que sinala unha áncora chamada seccion_2:

http://unsitio.com/html/principal.html#seccion_2

2.1.3 URI relativos

Un URI relativo non contén nengunha información sobre o esquema de nomes. A sua rota refere-se polo xeral a un recurso na mesma máquina que o documento actual. Os URI relativos poden conter componentes de rota relativos (p.ex.: ".." significa un nível máis alto na hierarquia definida pola rota), e poden conter identificadores de fragmentos .

Os URI relativos resolven-se en URI completos usando un URI base. Como exemplo de resolución de URI relativo, asumimos que temos o URI base "http://www.acme.com/support/intro.html". O URI relativo no código dun vínculo de hipertexto seguinte:

   <A href="fornecedores.html">Fornecedores</A>

expandiria-se ao URI completo "http://www.acme.com/soporte/fornecedores.html", mentres que o URI relativo no código dunha imaxe seguinte

   <IMG src="../icones/logo.gif" alt="logo">

expandiria-se ao URI completo "http://www.acme.com/icones/logo.gif".

En HTML, os URI usan-se para :

Consulte a sección sobre o tipo URI para máis información sobre URI.

2.2 Que é a HTML?

Para publicar información para a sua distribución global, necesita-se unha linguaxe que se entenda universalmente, unha espécie de língua nativa para a publicación que todos os computadores poidan potencialmente comprender. A linguaxe de publicación utilizada na Rede Mundial é a HTML (do inglés HyperText Markup Language, Linguaxe de etiquetaxe de hipertexto).

A HTML dá-lles aos autores os meios para:

2.2.1 Breve história da HTML

A HTML foi desenvolvida orixinalmente por Tim Berners-Lee cando traballaba no CERN e popularizou-se co navegador Mosaic desenvolvido pola NCSA. Durante a década dos 1990, floreceu co medre explosivo da Rede. Durante este tempo, a HTML expandiu-se en moitos ámbitos. A Rede depende de que os autores de páxinas e as empresas compartillen as mesmas convencións de HTML.

A HTML 2.0 (Novembro de 1995, ver [RFC1866] ) desenvolveu-se baixo os auspícios da Forza de traballo de enxeñaria da Internet ( Internet Engineering Task Force, IETF) para codificar o que era prática habitual a fins de 1994. HTML+ (1993) e HTML 3.0 (1995, ver [HTML30] ) propuxo versións de HTML moito máis ricas. Apesar de non teren recibido o consenso nas discusións sobre padróns, estes borradores conduciron à adopción dunha variedade de novos rasgos. Os esforzos do Grupo de Traballo en HTML do Consórcio da Rede Mundial (World Wide Web Consortium's HTML Working Group) en codificar o que era a práctica habitual en 1996 resultaron na HTML 3.2 (Xaneiro de 1997, ver [HTML32] ). As alteracións desde a HTML 3.2 aparecen resumidas no Apéndice A

A maioria da xente concorda en que os documentos en HTML deberian traballar ben nos diferentes navegadores e plataformas. Atinxir a inteoperabilidade diminue o coste dos fornecedores xa que deben desenvolver unha única versión dun documento. Se non se fai ese esforzo hai un risco moito maior de que a Rede se convirta nun mundo proprietário de formatos incompatíbeis, acabando por reducir-lles o potencial comercial da Rede a todos os participantes.

Cada versión da HTML ten tentado reflectir un consenso cada vez maior entre os interlocutores da indústria de maneira que o investimento feito polos fornecedores de conteúdos non se desperdície e que os seus documentos non resulten ilexíbeis nun corto período de tempo.

A HTML desenvolveu-se coa visión de que todo tipo de dispositivos deberia ser capaz de usar a información da Rede: PCs con pantallas gráficas de distinta resolución e profundidade de cores, telemóbeis, dispositivos de man, dispositivos que usen a voz para introducir e emitir dados, computadores con ancho de banda alto ou baixo, etc.

2.3 HTML 4

A HTML 4 extende a HTML con mecanismos para follas de estilo, scripts, molduras, obxectos incrustrados, solucións melloradas para texto de direita a esquerda e en direccións mescladas, tabelas máis ricas e mellora nos formulários, oferecendo acesibilidade mellorada para persoas con discapacidades.

A HTML 4.01 é unha revisión da HTML 4.0 que corrixe erros e fai algunhas modificacións desde a versión anterior.

2.3.1 Internacionalización

Esta versión da HTML foi deseñada coa axuda de expertos no campo da internacionalización, de maneira que os documentos se poidan escreber en todos os idiomas e que poidan ser transportados facilmente por todo o mundo. Isto logrou-se incorporando [RFC2070] , que trata da internacionalización da HTML.

Un paso importante foi a adopción do padrón ISO/IEC:10646 (ver [ISO10646] ) como conxunto de caracteres do documento da HTML. Este é o padrón máis compreensivo do mundo que trata as questións da representación de caracteres internacionais, dirección do texto, puntuación e outras questións dos idiomas do mundo.

A HTML oferece agora un suporte mellor para distintas línguas naturais dentro dun documento. Isto permite a indización máis efectiva dos documentos para os motores de pesquisa, tipografia de mellor calidade, mellor conversión de texto a voz, mellor uso dos hífens dentro das palabras, etc.

2.3.2 Acesibilidade

Segundo vai medrando a comunidade de usuários da Rede e os seus membros se fan máis diferentes en razón das suas capacidades e destrezas, resulta crucial que as tecnoloxias subxacentes sexan apropriadas para as suas necesidades específicas. A HTML deseñou-se para facer que as páxinas web sexan máis acesíbeis para as persoas con discapacidades físicas. Os desenvolvimentos da HTML 4 que se inspiraron en preocupacións pola acesibilidade incluen:

Os autores que deseñen páxinas tendo en conta as questións de acesibilidade non só receberán as benzóns da comunidade relacionada coa acesibilidade, senón que tamén se benificiarán noutros aspeitos: os documentos HTML ben deseñados que distingan entre estrutura e apresentación adaptarán-se máis doadamente às novas tecnoloxias.

Nota. Para máis información sobre o deseño de documentos HTML acesíbeis, consulte [WAI] .

2.3.3 Tabelas

O novo modelo de tabelas da HTML basea-se en [RFC1942] . Os autores teñen agora un maior control sobre a estrutura e a disposición (p.ex.: grupos de colunas). A capacidade dos deseñadores de recomendar anchos de coluna permite que os axentes de usuário mostren os dados das tabelas incrementalmente (segundo van chegando) en vez de agardar pola tabela inteira antes de mostrar nada.

Nota. No momento de escreber isto, algunhas ferramentas de deseño de HTML descansan en boa medida no formatado das tabelas, o que pode ocasionar problemas de acesibilidade.

2.3.4 Documentos compostos

A HTML oferece agora un mecanismo padrón para incluir obxectos de médios xenéricos e aplicacións nos documentos HTML. O elemento OBJECT (xunto cos seus elementos antecesores máis específicos IMG e APPLET ) fornece un mecanismo para a inclusión de imaxes, video, son, matemáticas, aplicacións especializadas e outros obxectos nun documento. Tamén permite que os autores especifiquen unha hierarquia de representacións alternativas para os axentes de usuário que non aceiten unha representación específica.

2.3.5 Follas de estilo

As follas de estilo simplifican a codificación da HTML e fan descansar en boa medida à HTML das responsibilidades da apresentación. Dan-lles tanto aos autores como aos usuários o control sobre a representación dos documentos -- información sobre tipos de letra, aliñamento, cores, etc.

A información de estilo pode-se especificar para elementos individuais ou para grupos de elementos. A información de estilo pode-se especificar nun documento HTML ou en follas de estilo externas.

O mecanismo para a asociación de follas de estilo cun documento é independente da linguaxe da folla de estilo.

Antes da chegada das follas de estilo, os autores tiñan un control limitado sobre a representación. HTML 3.2 incluíu moitos atributos e elementos que oferecian o control do aliñamento, o tamaño das fontes e a cor do texto. Os autores tamén explotaban as tabelas e as imaxes como meio de dispor os conteúdos das páxinas. O tempo relativamente longo que lles leva aos usuários actualizar os seus navegadores significa que estes rasgos continuarán a ser usados durante algun tempo. Porén, dado que as follas de estilo oferecen mecanismos de apresentación máis poderosos, o Consórcio da Rede Mundial acabará por eliminar moitos dos elementos e atributos de apresentación da HTML. Ao longo da especificación, os elementos e atributos que corren o risco de aparecen marcados como "desaprovados ". Acompañan-se de exemplos de como atinxir os memos efectos con outros elementos ou con follas de estilo.

2.3.6 Scripts

Cos scripts os autores poden crear páxinas web dinámicas (p.ex.: "formulários intelixentes" que reaccionan segundo os usuários os van preenchendo) e usar a HTML como meio de construir aplicacións en rede.

Os mecanismos que se fornecen para incluir scripts nun documento HTML son independentes da linguaxe de script.

2.3.7 Impresión

Às veces, os autores quererán-lles facilitar aos usuários a impresión de máis que só o documento actual. Cando os documentos forman parte dun traballo máis longo, as relacións entre eles poden-se descreber usando o elemento LINK da HTML ou usando o Marco de descrición de recursos (RDF) do W3C (ver [RDF10] ).

2.4 Creación de documentos con HTML 4

Recomendamos que os autores e implementadores sigan os princípos xerais seguintes cando traballen con HTML 4.

2.4.1 Separar estrutura e apresentación

A HTML ten as suas raíces na SGML, que sempre foi unha linguaxe para a especificación de codificación estrutural. Segundo a HTML vai madurecendo, cada vez máis dous seus elementos e atributos de apresentación van sendo substituídos por outros mecanismos, en concreto por follas de estilo. A experiéncia mostra que separar a estrutura dun documento dos seus aspeitos de representación reduce o custo de servir unha gama diversa de plataformas, meios, etc., e facilita as revisións do documento.

2.4.2 Considerar a acesibilidade universal à Rede

Para facer a Rede máis acesíbel para todos, en particular para as persoas con discapacidades, os autores deberian considerar como se van mostrar os seus documentos en diversas plataformas: navegadores baseados na voz, leitores de braille, etc. Non recomendamos que os creadores limiten a sua creatividade ou que só consideren representacións alternativas no seu deseño. A HTML oferece moitos mecanismos para consegui-lo (p.ex.: o atributo alt , o atributo accesskey , etc.)

Ademáis, os autores deberian ter en conta que os seus documentos poden-lles estar a chegar a un público lonxíncuo con configuracións de computador diferentes. Para que os documentos se interpreten correctamente, os autores deberian incluir nos seus documentos información sobre o idioma e a dirección do texto, como está codificado o documento e outras questións relacionadas coa internacionalización.

2.4.3 Axudar aos axentes de usuário coa representación incremental

Co deseño cuidadoso das suas tabelas e co uso das novas características da HTML 4, os autores poden axudar-lles aos axentes de usuário a mostrar os documentos máis rapidamente. Os autores poden aprender a deseñar tabelas con representación incremental (ver o elemento TABLE ). Os implementadores deberian consultar as notas sobre as tabelas do apéndice para información sobre algoritmos incrementais.