Načrtovanje in razvoj spletnih aplikacij

Kodiranje znakov

Če na spletni strani uporabljamo šumnike ali druge posebne znake, moramo brskalniku sporočiti, kako so ti znaki zapisani na datoteki. Vsak znak je na datoteki predstavljen s svojo kodo (ki je običajno ne vidimo), kakšna je ta koda, pa je odvisno od vrste uporabljenega kodiranja.

Slovenski šumniki v HTML

Programi pod operacijskim sistemom Windows s slovenskimi nastavitvami največkrat uporabljajo kodiranje windows-1250, pod operacijskim sistemom Linux s slovenskimi nastavitvami pa kodiranje iso-8859-2 (uradno ime za Latin2). Zelo uporabno je kodiranje utf-8, ki podpira vse znake iz tabele Unicode. Poznata ga oba sistema, seveda pa moramo imeti ustrezen urejevalnik datotek, ki takšno kodiranje podpira. To npr. omogoča Notepad++ (v meniju Oblika izberemo Kodiraj v UTF-8 ali pa Pretvori v UTF-8).

V datoteki HTML uporabljeno kodiranje določimo v glavi z uporabo elementa meta. To je element s prazno vsebino.

Primer kodiranja v HTML5, kjer uporabimo kodiranje Unicode:

<meta charset="utf-8">

Primer istega kodiranja v XHTML:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Splošna rešitev za pisanje šumnikov je uporaba kode znakov v obliki: &#n; kjer je n ustrezna številka iz prvega stolpca spodnje tabele. Npr. mali č zapišemo kot: &#269;.

Številka Znak
268 Č
269 č
352 Š
353 š
381 Ž
382 ž

Kodiranje posebnih HTML znakov

Nekateri znaki v HTML imajo poseben pomen. Ti znaki so < (manjši), > (večji), " (dvojni narekovaj) in & (in). Če jih želimo uporabiti v besedilu, moramo uporabiti njihova imena, določena s standardom SGML, na primer takole:

Opis Znak
&lt; <
&gt; >
&quot; "
&amp; &

Obstajajo tudi znaki, ki bi jih želeli vključiti na spletno stran, a jih nimamo na tipkovnici. Tudi v takih primerih uporabimo imena znakov, določena s standardom SGML. Naštejmo nekaj primerov takih znakov:

Opis Znak
&nbsp; trdi presledek
&copy; ©
&euro;

Seznam vseh posebnih znakov si lahko ogledate na w3schools.com.

Če imena znaka ne poznamo, lahko namesto imena napišemo tudi njegovo desetiško ali šestnajstiško kodo iz tabele Unicode. Desetiško kodo pričnemo z znakom #, ki mu sledi zaporedje desetiških števk, šestnajstiško kodo pa z znakoma #x, sledi pa zaporedje šestnajstiških števk. Trdi presledek bi torej lahko napisali kot &nbsp;, kot &#160; ali pa kot &#xa0;.

Seznam vseh znakov Unicode si lahko ogledate na w3schools.com.