Oglasi  
     




  Prijatelji  
     


 HTML TUTORIJALI

Kodiranje HTML dokumenata

Često vidim na internetu hrvatske webove kojima nedostaju hrvatski dijakritički znakovi (š,đ,č,ć,ž). Često ih ljudi jednostavno ne pišu jer im je valjda "preteško" pisati točno ali često zna biti slučaj da njihove web stranice ne podržavaju sve naše znakove.

Naime, svaki HTML dokument se treba kodirati u odgovarajućem skupu znakova tj. kodu.

Većina programa za stvaranje HTML datoteka koriste ISO-8859-1 kao preodređeni kod. Njemu je baza latinsko pismo s određenim dodatnim znakovima. Sljedeći jezici mogu koristiti ISO-8859-1 bez bojazni da im se neka slova neće točno prikazati: švedski, engleski, norveški, islandski, irski, danski, škotski, španjolski, portugalsk, njemački, itd.

Za hrvatski jezik je potreban drugi kod koji podržava naše dijakritičke znakove. Ustvari, postoje 2 koda koja su nam od koristi. Prvi je ISO-8859-2 i koriste ga mnogi slavenski jezici od kojih su neki poljski, hrvatski, češki, slovački, srpski (latinica), slovenski, itd. Drugi kod je UTF-8. On je uniformni koji je osmišljen da sadržava sve svjetke znakove . U njemu se može pisati ćirilicom, kineskim, japanskim, sanskrtom i gotovo svim pismima svijeta uz iznimke. Preporučam njegovo korištenje iz dva razloga. Prvi je taj što nikad ne znate kada ćete morati koristiti znakove koje vaš trenutni kod ne podržava a drugi je taj što većina današnjih tekstualnih editora koje koristimo za stvaranje HTML datoteka nema mogućnost kodiranja u ISO-8859-2 formatu.

To je bio uvod u kodiranje HTML dokumenata (ali i praktički svih ostalih) a sada je vrijeme da vam i pokažem kako se to radi. Primjera radi koristit ću par najpopularnijih tekstualnih editora.

Što svi često misle, kodiranje HTML dokumenta nije samo dodavanje sljedećeg meta taga u head dio stranice:

<meta http-equiv="content-type" content="text/html; charset=utf-8">


To vrijedi jedino ako koristite windows-1250 kodiranje što ne preporučam jer onda Linux, Mac i ostali korisnici neće ispravno vidjeti sve znakove. To kodiranje je SAMO za korisnike s Windowsima.

Osim što treba staviti taj dio koda u head dio dokumenta (a ni to nije uvijek potrebno) treba i SPREMITI datoteku u odgovarajućem kodiranju. Kod svakog editora je ovo drugačije a ja sam ovdje naveo nekoliko popularnijih. Ako koristite neki program koji nije ovdje naveden probajte naći opciju tipa file encoding, character encoding, encoding, file type ili slično te odaberite kodiranje koje želite. Većina programa, osim onih opširnijih kao Dreamweaver ili Frontpage, neće imati ISO-8859-2 ali i tako je bolje koristiti UTF-8.

Notepad

Kod spremanja datoteke imate polje Encoding. Odaberite UTF-8 umjesto ANSI.

Notepad++

Otiđite na Format->Encode in UTF-8 ili UTF-8 without BOM. BOM (byte order mark) je jedna stvarčica vezana uz UTF kodiranje ali je najbolje da je izbjegavajte jer stariji pretraživači (a i noviji nekad) znaju ispisati na početku dokumenta čudne znakove što je posljedica korištenja BOM-a.

Ako želite da vam svi novi dokumenti u Notepadu++ budu kodirani u UTF-8 onda kliknite na Edit->Preferences... i pod tabom New Document odaberite UTF-8 (sa ili bez BOM-a, po želji).




_________________________

Autor ovog tutorijala: Tomislav

Copyright - Tutorijali.Net 2006 - 2012