Če na spletni strani uporabljamo šumnike ali druge posebne znake, moramo brskalniku sporočiti, kako so ti znaki zapisani na datoteki. Vsak znak je na datoteki predstavljen s svojo kodo (ki je običajno ne vidimo), kakšna je ta koda, pa je odvisno od vrste uporabljenega kodiranja.
Slovenski šumniki v HTML
Programi pod operacijskim sistemom Windows s slovenskimi nastavitvami največkrat uporabljajo kodiranje windows-1250
, pod operacijskim sistemom Linux s slovenskimi nastavitvami pa kodiranje iso-8859-2
(uradno ime za Latin2). Zelo uporabno je kodiranje utf-8
, ki podpira vse znake iz tabele Unicode. Poznata ga oba sistema, seveda pa moramo imeti ustrezen urejevalnik datotek, ki takšno kodiranje podpira. To npr. omogoča Notepad++ (v meniju Oblika izberemo Kodiraj v UTF-8 ali pa Pretvori v UTF-8).
V datoteki HTML uporabljeno kodiranje določimo v glavi z uporabo elementa meta
. To je element s prazno vsebino.
Primer kodiranja v HTML5, kjer uporabimo kodiranje Unicode:
<meta charset="utf-8">
Primer istega kodiranja v XHTML:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
Splošna rešitev za pisanje šumnikov je uporaba kode znakov v obliki: &#n;
kjer je n
ustrezna številka iz prvega stolpca spodnje tabele. Npr. mali č
zapišemo kot: č
.
Številka | Znak |
---|---|
268 | Č |
269 | č |
352 | Š |
353 | š |
381 | Ž |
382 | ž |
Kodiranje posebnih HTML znakov
Nekateri znaki v HTML imajo poseben pomen. Ti znaki so < (manjši), > (večji), " (dvojni narekovaj) in & (in). Če jih želimo uporabiti v besedilu, moramo uporabiti njihova imena, določena s standardom SGML, na primer takole:
Opis | Znak |
---|---|
< | < |
> | > |
" | " |
& | & |
Obstajajo tudi znaki, ki bi jih želeli vključiti na spletno stran, a jih nimamo na tipkovnici. Tudi v takih primerih uporabimo imena znakov, določena s standardom SGML. Naštejmo nekaj primerov takih znakov:
Opis | Znak |
---|---|
| trdi presledek |
© | © |
€ | € |
Seznam vseh posebnih znakov si lahko ogledate na w3schools.com.
Če imena znaka ne poznamo, lahko namesto imena napišemo tudi njegovo desetiško ali šestnajstiško kodo iz tabele Unicode. Desetiško kodo pričnemo z znakom #
, ki mu sledi zaporedje desetiških števk, šestnajstiško kodo pa z znakoma #x
, sledi pa zaporedje šestnajstiških števk. Trdi presledek bi torej lahko napisali kot
, kot  
ali pa kot  
.
Seznam vseh znakov Unicode si lahko ogledate na w3schools.com.