HTML nyelv bemutatása
A HTML kialakulása
A szövegek valamilyen céllal való megjelölése, metaadatokkal való ellátása már a számítógépes nyelvek kialakulása előtt elterjedt. A nyomdászok és szedők számára például bevett szokás volt bizonyos jelzésekkel ellátni a kéziratokat, ami jelezte a kiadvány végső formájában használandó betűképet, stílust, margókat stb. A jelzéseket leggyakrabban a szerkesztők, korrektorok és grafikusok helyezték el kéziratokban.
A hypertext elméletét Dr. Vannevar Bush, az Amerikai Tudományos Kutatóintézet igazgatója vázolta fel a múlt század 40-es éveiben, mint egy számítógépen tárolt, egymáshoz kapcsolt információk halmazát (web), amit bárki böngészhet, és könnyedén kiegészíthet a saját dokumentumaival.
A W3C konzorcium vállalta magára az internet nyelvének kifejlesztését. A HTML szabvány átvételével és továbbfejlesztésével különböző szabvány-ajánlásokat készítenek, hogy megkönnyítsék a webfejlesztők munkáját. A társulás tagjai olyan cégek, akik maguk is jelentős összegeket költenek az internetfejlesztésére.
A HTML felépítése
A HTML (angolul: HyperText Markup Language=hiperszöveges jelölőnyelv) egy leíró nyelv, melyet weboldalak készítéséhez fejlesztettek ki, és mára már internetes szabvánnyá vált a W3C (World Wide Web Consortium) támogatásával.
A HTML nyelv "TAG"-ekbõl áll. (kiejtése: "teg"!)
Ezek a TAG-ek rendkívül sokfélék lehetnek. Egy HTML-lap megírás után egybõl megtekinthetõ bármelyik Internetes böngészõben - akár kapcsolat nélkül is. Weblap szerkesztésére a legegyszerûbb program egy Jegyzettömb. Fontos, hogy a kész file-nak HTM vagy HTML kiterjesztést adjunk és a névben legyünk megfontoltak. Ha minimum Windows 95-ös környezethez szoktunk, akkor általában hosszabb és többtagú file-nevekben szoktunk menteni.
HTML általában szöveges állományokban található meg olyan számítógépeken, melyek az internethez kapcsolódnak. Ezek az állományok tartalmazzák azokat a szimbólumokat, amelyek a megjelenítő programnak leírják, hogyan is kell megjeleníteni illetve feldolgozni az adott állomány tartalmát. Megjelenítő program lehet egy webböngésző (angolul: web browser), aural böngésző (olyan, amelyik a felhasználónak felolvassa a megjelenítendő szöveget), braille olvasó, amely konvertálja a szöveget braille "formátumba", levelező program (mint például: Mozilla Thunderbird, Microsoft Outlook, Eudora stb.), valamint egyéb eszközök, például mobiltelefon.
A dolog lényege, hogy nem kell tagolni a szöveget, nem kell semmi különös formátumos trükköt ismerni, csak a kész anyagot megnézni és már mûködik is a weblap. Ráadásul egyszerûbb lapok esetén ez minden egyes gépen ugyanígy néz ki. Nem szabad elfelejteni, hogy egy weblapot mindig és tagek közé kell tenni.
A WEB világában a statikus honlaptípus a legegyszerűbb. Ez szöveget, esetleg képeket, táblázatokat tartalmaz. A szövegben linkek vannak, amelyekre kattintva további weblapokra léphetsz át. A statikus oldalak tartalma általában egy - a szerverre feltöltött – html dokumentumban van rögzítve.
Négyfajta szimbólum (leíró elem) található meg a HTML-ben:
* strukturális elemek, amelyek leírják az adott szöveg "célját", mint első szintű címsor (alcím).
* prezentációs szimbólumok, melyek leírják, az adott szöveg hogy nézzen ki. (Ez a forma azonban ma már elavultnak számít, helyette a CSS használata javasolt, ugyanis a legújabb irányelv szerint szét kell választani a tartalmat (amit a HTML kódol) és a formát (amit CSS-ben szokás kódolni), és ezáltal mindenki számára elérhetővé tehetőek a weblapok: felolvasó gépeknek, amit a gyengén látók használnak, szöveges böngészőknek, és könnyebb nyomtatóbarát verziót készíteni.)
* hiperszöveg (hypertext) elemek, melyek segítségével kapcsolat létesíthető a dokumentum egyes elemei és más dokumentumok között.
HTML dokumentumot a következő részekre lehet bontani a fejlécre és dokumentumtörzsre. (Egy harmadik rész lehet a keretek definíciója.)
A dokumentumot a fejlécelemek vezetik be, melyek kezdetét a utasítás jelzi. A fejlécelemek között szokás a dokumentumcímet megadni, mely címet a és a utasítások közé kell zárni. A fejlécet a utasítás zárja. Ezt a részét a dokumentumnak általában az ablak címsorában jelenítik meg a böngészőprogramok.
A dokumentumtörzs - amit voltaképpen a WEB-böngésző meg fog jeleníteni - a fájl és utasítások közötti része. Ezen elemek között kell elhelyezni mindent: a szöveget, hivatkozásokat, képeket, stb. (A keretek és a JavaScript kódok kivételével!)
Egy HTML dokumentum alapértelmezésként ISO-8859-1, azaz nyugat-európai kódolást használ. Gyakran előforduló hiba szokott lenni, hogy nincs beállítva a charset paraméter a fejléc content attribútumában, annak ellenére, hogy a dokumentum nem nyugat-európai kódolású szöveget tartalmaz. Magyar nyelvű oldalak esetén ilyenkor találunk, olyan karaktereket amelyeket látunk, de az is lehet, hogy minden ékezetes betű teljesen olvashatatlanná válik (ha például a megjelenítendő szöveg UTF-8 kódolású). A charset paraméter értékeként több száz kódolás és érvényes alternatív név (alias) megadható.
Karakter egyedhivatkozások
Az SGML számos Unicode karakterhez definiál egyedi megnevekzéseket, azonban a HTML a lehetséges SGML egyedeknek csak egy részét használja (a használt egyedeket a dokumentum DTD-jében kell megadni, és a HTML 4.01-es verziójáig ez nem tartalmazza a közép-európai karaktereket). Emiatt a magyar ékezetes karakterek közül is csak azokra lehetséges SGML egyedhivatkozást megadni, melyek a nyugat-európai kódkészletben is megtalálhatók. Vagyis hiába definiálja az SGML, hivatalosan azt egy böngészőnek nem kell tudnia megjeleníteni egy 4.01-es HTML dokumentumot esetén.
A HTML verziói
1994-ben megalakult a World Wide Web Consortium (rövidítve: W3C), ez a világhálóra vonatkozó szabványi előírások létrehozásával és közzétételével foglalkozó szervezet.
Egy W3C szabvány a következő szakaszokon megy keresztül: Working Draft (munkavázlat), Last Call Working Draft (utolsó hívás), Candidate Recommendation (jelölt ajánlás) és Proposed Recommendation (tervezett ajánlás). A végső szakasz a W3C Recommendation, azaz ajánlás szakasz, amikor már teljesen kész van egy szabvány, és a W3C „éles” használatra ajánlja. Az is előfordul, hogy a W3C egy ajánlást visszaminősít munkavázlattá, vagy egy már meglévő ajánlás újabb változatát adja ki. Egy szabvány elavulttá is válhat, ha többé már nem ajánla a W3C használatra.
|
Verzió |
ajánlás éve |
Jelenlegi státusz |
|
HTML 2.0 |
1995. november |
Elavult |
|
HTML 3.2 |
1997. január |
Elavult |
|
HTML 4.0 |
1997. december |
Elavult |
|
HTML 4.01 |
1999. december |
Ajánlás |
|
HTML 5 |
- - - - - - - - - - - - - |
Munkavázlat |
1995-ben elkészült a „HTML 2.0”, amely sok ötletet merített az eredeti HTML ajánlásból. Dave Raggett készített egy alternatív javaslatot is HTML+ névvel, amely sok új elem fejlesztésének alapjául szolgált a böngészőkben (például a képek behelyezésének a módszere a dokumentumokba, amelyben az NCSA Mosaic volt az úttörő).
A HTML 3.0 ajánlása még ugyanebben az évben érkezett, de hamar befejezték vele a munkát, mivel a böngészőgyártók teljesen más irányokban kezdtek el fejleszteni.
A W3C 1997 januárjában nyilvánította ajánlássá a HTML 3.2-t. Sok funkciót elhagyott a HTML 3.0-ból, és helyettük beépítette a népszerűbb böngészők (mint a Mosaic és a Netscape Navigator) különböző fejlesztéseit.
A HTML 2.0 és 3.2 szabványban a latin-1 kódot írták elő, így elvileg nem lehetett helyes magyar ékezetes betűket előcsalogatni.
A 4.0 szabvány már megengedi hogy az UCS (Universal Character Set, ISO10646 szabvány) készlet bármelyik betűjét használhassuk. (Az UCS ugyanazt a több ezer betűt tartalmazza, mint az UNICODE, amely több mint 30000 betűt tartalmaz a világ gyakrabban használt írásmódjaiból).
Ebbben a verzióban, még több böngésző-sepcifikus kiterjesztést próbáltak meg ésszerűsíteni és egyszerűbbé tenni. Ezt azzal érték el, hogy több elemet elavultként jelöltek meg — ez azt jelenti, hogy ezek az elemek még léteznek ebben a verzióban (elavultként megjelölve), de a következőben már teljesen törölve lesznek. Ezzel próbálták meg a fejlesztőket rávenni arra, hogy a HTML-t szemantikusabban használják (erről részletesebben A webes szabványok modellje leírásban olvashatsz).
A HTML 4.01 1999-ben jelent meg, majd néhány elírást javítottak benne 2001-ben. Ez az utolsó HTML verzió, bár jelenleg már elérhető a HTML 5 vázlata is.