HTML

Afdrukken PDF
Geschreven door Remco op zaterdag 20 september 2008 19:04, in: Overige

HyperText Markup Language (afgekort HTML) is een taal voor de opmaak van documenten. HTML wordt vooral gebruikt op het World Wide Web, om webpagina's te tonen.

 Inleiding

In de meest basale vorm wordt HTML gebruikt voor indeling van tekst in paragrafen met kopjes en stukjes tekst die vet of cursief worden weergegeven. Essentieel is dat HTML hypertekst mogelijk maakt, waardoor in een document verwijzingen kunnen worden ingebouwd naar andere documenten. Zo'n verwijzing heet een hyperlink (in het Nederlands ook wel koppeling). HTML biedt ook de mogelijkheid om plaatjes en multimedia in een document op te nemen. HTML bestaat uit platte tekst waarin met markeringstekens is aangegeven hoe de tekst moet worden gepresenteerd. Zo'n markering wordt (naar het Engels) een tag genoemd - er is geen goed Nederlands woord voor. HTML wordt meestal bekeken met een browser, een programma dat HTML-documenten opvraagt en als opgemaakte tekst aan de gebruiker toont. In de loop der jaren is het aantal verschillende markeringstekens (tags) dat in HTML wordt gebruikt, enorm uitgebreid. Om interpretatieproblemen te voorkomen heeft het World Wide Web Consortium (W3C) een standaard opgesteld over welke tags geldig zijn en hoe ze moeten worden geïnterpreteerd. De standaard is een aantal malen aangepast in verband met verdere ontwikkeling van HTML. De laatst geaccepteerde standaard, HTML 4.01, dateert van december 1999. HTML als markeringstaal is onvoldoende gebleken om in de behoefte aan nauwkeurige vormgeving en interactiviteit te voorzien. Toevoegingen aan HTML zijn Cascading Style Sheets (vooral voor nauwkeurige vormgeving van documenten) en Javascript (ten behoeve van interactiviteit van documenten). De concurrentiestrijd tussen producenten van webbrowsers heeft een belangrijke rol gespeeld in de ontwikkeling van HTML. Producenten ontwikkelden op eigen houtje nieuwe tags, die vaak niet door andere webbrowsers werden begrepen, hadden eigen interpretaties van stylesheets en een eigen interpretatie van javascript. Sommige van deze HTML tags zijn later opgenomen in de standaard, andere niet. Ook nu nog zijn daarvan relicten te vinden in moderne browsers. Er zijn enkele varianten en verwanten van HTML:

  • CHTML, een beperkte vorm van HTML, ontwikkeld voor gebruik op PDA's en mobiele telefoons.
  • Dynamic HTML of DHTML. Geen officiële specificatie, maar een marketing term voor HTML, die werd gebruikt bij het uitkomen van de versie 4 browsers. De term wordt gebruikt voor de combinatie van Javascript en
  • HTML waarbij pagina's ook tijdens het gebruik van inhoud en opmaak kunnen wijzigen.
  • WML (Wireless Markup Language), ontwikkeld voor gebruik op WAP apparaten.
  • XHTML, de beoogde opvolger van HTML. 

Geschiedenis van HTML

De geschiedenis van HTML ging in de eerste jaren hand in hand met de ontwikkeling van webbrowsers. De belangrijkste spelers daarin waren de concurrerende browsers van Netscape en Microsoft (bekend als de browseroorlog). Met elke uitgebrachte browserversie werd de HTML uitgebreid of aangepast. De W3C probeerde standaarden vast te stellen, maar moest regelmatig constateren dat de standaard waaraan gewerkt werd, inmiddels achterhaald was. HTML werd in 1991 bedacht en ontwikkeld door Tim Berners-Lee om wetenschappelijke documenten van het CERN in Genève gemakkelijker toegankelijk te maken. Hij ontwikkelde ook de eerste webbrowser, WorldWideWeb genaamd. In 1993 werd de webbrowser Mosaic ontwikkeld door het NCSA, die als eerste grafische elementen in HTML ondersteunde. Op basis daarvan ontstond in 1994 Netscape Navigator. Met de komst van deze beide browsers werd het World Wide Web echt populair. Beide browsers voegden elementen toe aan de oorspronkelijk HTML. Kort daarop mengde Microsoft zich in de strijd met een eigen webbrowser. De eerste officiële specificatie van HTML door de W3C organisatie was HTML 2.0, geaccepteerd in september 1995. Eerder was er gewerkt aan uitbreiding van de oorspronkelijke standaard onder de naam HTML+ (gepubliceerd in november 1993). Al vóór de officiële acceptatie van van HTML 2.0, werd er de volgende specificatie (HTML 3.0) voorbereid. Deze specificatie werd achterhaald door het uitkomen van Netscape versie 3 en het voorstel werd in september 1995 verlaten. Het werk werd voortgezet in HTML versie 3.2, dat de naam "Wilbur" meekreeg. Wilbur werd geaccepteerd in januari 1997. In december 1997 werd de HTML 4.0 specificatie geaccepteerd, waarop nog enkele kleine correcties zijn aangebracht in HTML 4.01 (geaccepteerd in december 1999). De HTML 4.01 specificatie is bedoeld als de laatste specificatie van HTML. Verdere ontwikkeling van de standaard vindt plaats als XHTML en HTML 5, naast de ontwikkeling van stylesheets en javascript. De verschillende specificaties zijn grotendeels backward compatible en moderne browsers kunnen documenten met oudere specificaties goed weergeven. Een aantal tags die ooit door browserproducenten zijn bedacht, zijn echter nooit in de specificaties terecht gekomen en worden ook niet door alle moderne browsers ondersteund.

Genereren van HTML documenten

Een HTML document kan als los document zijn opgeslagen op een opslagmedium. Dergelijke documenten hebben als extensie .htm of .html. Op het World Wide Web worden (tijdelijke) HTML documenten vaak op verzoek van een browser gegenereerd met behulp van server-side scripting of CGI. Dergelijke pagina's hebben meestal een URL waarin een andere extensie wordt gebruikt, bijvoorbeeld .asp voor Active Server Pages en .php als het document is gegenereerd met PHP, wat door Joomla wordt gebruikt. (X)HTML kan ook worden gegenereerd door transformatie van XML en XSL, waarbij de inhoudelijke gegevens in de XML staan en de vormgeving (structuur) in de XSL staat. De browsers van o.a. Mozilla en Microsoft zijn in staat deze transformatie uit te voeren. Andere browsers ondersteunen dit soms niet. De transformatie kan echter ook op de webserver worden uitgevoerd.

De opbouw van een HTML document.

Technisch gezien is HTML een formele markup-taal, gebaseerd op SGML. Ook XML is een subset van SGML. XHTML heeft zowel eigenschappen van XML als van HTML. Een DOCTYPE declaratie aan het begin van het document geeft aan volgens welke specificatie de HTML moet worden geïnterpreteerd. Moderne browsers kennen twee manieren om een HTML document weer te geven: de Standards compliance mode dat gebruikt wordt voor documenten die voldoen aan de strikte HTML specificatie, en de Quirksmode dat gebruikt wordt voor oudere specificaties. De keuze wordt gemaakt op basis van de DOCTYPE declaratie. Een correct HTML document bestaat naast deze declaratie uit één html element, dat weer bestaat uit één header element plus één body of één frameset element. In de header staat informatie over het document, zoals de titel en eventueel gebruikte stylesheets, scripts, en metatags. De body bevat informatie die in het document zichtbaar is. Bij gebruik van een frameset worden andere (HTML) documenten in de frames getoond. HTML is uitgegroeid van opgemaakte tekst met plaatjes tot een object-georiënteerde benadering van een document. Ook daar heeft het W3C een standaard voor ontwikkeld: het Document Object Model, (afgekort tot DOM). Het DOM maakt het mogelijk dat met behulp van scripts, alle elementen van een document afzonderlijk kunnen worden benaderd en aangepast, ook kunnen nieuwe elementen worden toegevoegd of bestaande elementen verwijderd.
Â