Forum | Najnowsze tutoriale tworzenie stron internetowych
 

HTML Zestawy znaków


Aby poprawnie wyświetlić stronę HTML, przeglądarka musi wiedzieć, co zestaw znaków (kodowanie) do użycia.


HTML Zestawy znaków

Co to jest poprawne kodowanie znaków do wykorzystania w HTML?

Dla HTML5, domyślne kodowanie znaków UTF-8.

Nie zawsze tak było. Kodowanie znaków dla wczesnej internecie był ASCII.

Później, z HTML 2.0 z HTML 4.01, ISO-8859-1 został uznany za standard.

Z XML i HTML5, UTF-8 w końcu dotarł i rozwiązać wiele problemów kodowania znaków.

Poniżej znajduje się krótki opis standardów kodowania znaków.


Na początku: ASCII

informacje o komputerze (numery, teksty i zdjęcia) jest przechowywana jako binarne zer i jedynek (01000101) w elektronice.

Aby ujednolicić przechowywanie znaków alfanumerycznych, American Standard Code dla Wymiany Informacji (ASCII) został utworzony. Jest zdefiniowana unikalny binarny numer 7-bitów dla każdego znaku chowanym wspierać cyfr od 0-9, górna / dolna przypadku alfabetu angielskiego (az, AZ), a niektóre znaki specjalne, takie jak! + $ - () @ <>.

Od ASCII użyty jeden bajt (7 bitów dla charakteru i jeden bit parzystości dla kontroli transmisji), może to stanowić jedynie 128 różnych znaków. Ponadto 32 z tych znaków były zarezerwowane dla innych celów kontrolnych.

Największą słabością z ASCII było to, że wykluczone niż angielskich liter.

ASCII jest nadal w powszechnym użyciu, zwłaszcza w dużych komputerach, systemach mainframe.

Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ASCII Reference .


W systemie Windows: ANSI

ANSI (zwany również Windows 1252) był domyślny zestaw znaków w systemie Windows, do Windows 95.

ANSI jest rozszerzeniem ASCII, z dodatkiem znaków międzynarodowych. Używa pełny bajt (8 bitów) do reprezentowania 256 różnych znaków.

Ponieważ ANSI jest domyślny zestaw znaków w Windows, to jest obsługiwane przez wszystkie przeglądarki.

Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ANSI Reference .


W HTML 4: ISO-8859-1

Ponieważ większość krajów używać znaków spoza ASCII, domyślne kodowanie znaków w standardzie HTML 2.0 została zmieniona na ISO-8859-1.

ISO-8859-1 jest rozszerzeniem ASCII, z dodatkiem znaków międzynarodowych. Podobnie jak ANSI, używa pełny bajt reprezentuje dwa razy więcej znaków niż ASCII.

Uwaga Gdy przeglądarka wykryje ISO-8859-1 na stronie internetowej, zazwyczaj domyślnie ANSI, ponieważ ANSI jest identyczny z ISO-8859-1, z wyjątkiem, że ANSI posiada 32 dodatkowych znaków.

Jeżeli HTML 4 strona używa innego zestawu znaków niż ISO-8859-1, powinien być określony w tagu <meta> takich jak:

Przykład

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Uwaga

Domyślnym zestawem znaków HTML5 jest UTF-8.
Wszystkie 4 procesory obsługują HTML UTF-8, a wszystkie procesory XML i HTML5 obsługują zarówno UTF-8 i UTF-16.

Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ISO-8859-1 Reference .


W HTML5: Unicode UTF-8

Ponieważ zestawy znaków wymienione powyżej są ograniczone i nie jest kompatybilny w środowiskach wielojęzycznych Konsorcjum Unicode opracowany standard Unicode.

Pokrywy Standardowe Unicode (prawie) wszystkie znaki, znaki przestankowe i symbole świata.

Unicode umożliwia przetwarzanie, przechowywanie i transport tekstu, niezależnie od platformy i języka.

Domyślne kodowanie znaków w HTML5 jest UTF-8.

Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna Reference Unicode .