Форум | Последние учебники веб-разработки
×

HTML Кодировки

HTML Кодировки HTML ASCII HTML ANSI HTML ISO-8859 HTML Символы HTML UTF-8

HTML UTF-8

Latin базовый Latin дополнение Latin расширенный A Latin расширенный B изменения пробела диакритических знаков Греческий и коптский Cyrillic базовый Cyrillic дополнение

HTML Символы

Общая пунктуация Currency Символы Letterlike Символы Стрелки Математические операторы Вставка Чертежи Блок Elements Геометрические фигуры Misc Символы Dingbats

HTML юридические лица

HTML4 юридические лица HTML5 юридические лица A HTML5 юридические лица B HTML5 юридические лица C HTML5 юридические лица D HTML5 юридические лица E HTML5 юридические лица F HTML5 юридические лица G HTML5 юридические лица H HTML5 юридические лица I HTML5 юридические лица J HTML5 юридические лица K HTML5 юридические лица L HTML5 юридические лица M HTML5 юридические лица N HTML5 юридические лица O HTML5 юридические лица P HTML5 юридические лица Q HTML5 юридические лица R HTML5 юридические лица S HTML5 юридические лица T HTML5 юридические лица U HTML5 юридические лица V HTML5 юридические лица W HTML5 юридические лица X HTML5 юридические лица Y HTML5 юридические лица Z

 

HTML наборы символов


Для корректного отображения страницы HTML, браузер должен знать, какой набор символов (кодировка символов) для использования.


HTML наборы символов

Что такое правильный кодировки символов для использования в HTML?

Для HTML5, кодировка символов по умолчанию является UTF-8.

Это не всегда было так. Кодировка символов для раннего веб был ASCII.

Позже, из HTML 2.0 для HTML 4.01, ISO-8859-1 считается стандартом.

С помощью XML и HTML5, UTF-8, наконец, прибыл, и решить множество проблем кодирования символов.

Ниже приводится краткое описание стандартов кодировки символов.


В начале: ASCII

Компьютерная информация (номера, тексты и рисунки) хранится в виде двоичных единиц и нулей (01000101) в электронике.

Для того, чтобы стандартизировать хранение буквенно-цифровых символов, был создан Американский стандартный код для обмена информацией (ASCII). Он определил уникальный двоичный 7-битное число для каждого хранимого характера для поддержки цифры от 0-9, верхний / нижний регистр буквы английского алфавита (AZ, AZ), а также некоторые специальные символы, такие как! $ + - () @ <>.

Поскольку ASCII используется один байт (7 битов для символа, а также один из бит для контроля четности передачи), она может представлять только 128 различных символов. Кроме того 32 из этих символов были зарезервированы для других целей управления.

Самая большая слабость с ASCII было то, что она исключала не являющимся английскими буквами.

ASCII все еще широко используются сегодня, особенно в больших ЭВМ компьютерных систем.

Для более близкого взгляда, пожалуйста , изучить наш Complete Reference ASCII .


В операционной системе Windows: ANSI

ANSI (также называемый Windows-1252) был набор символов по умолчанию в Windows, вплоть до Windows 95.

ANSI является расширением ASCII, с добавлением международных символов. Он использует полный байт (8-бит) для представления 256 различных символов.

Так как ANSI был набор символов по умолчанию в Windows, он поддерживается всеми браузерами.

Для более близкого взгляда, пожалуйста , изучить наш полный ANSI Reference .


В HTML 4: ISO-8859-1

Поскольку большинство стран используют символы вне ASCII, кодировка символов по умолчанию в стандарте HTML 2.0 был изменен на ISO-8859-1.

ISO-8859-1 является расширением ASCII, с добавлением международных символов. Как ANSI, он использует полный байт для представления в два раза больше символов, чем ASCII.

Заметка Когда браузеры обнаружить ISO-8859-1 на веб-странице, они обычно по умолчанию ANSI, потому что ANSI идентичен ISO-8859-1, за исключением, что ANSI имеет 32 дополнительных символов.

Если веб-страница HTML 4 использует другой символьный набор, чем ISO-8859-1, он должен быть указан в теге <META> как:

пример

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Заметка

Набором символов по умолчанию для HTML5 является UTF-8.
Все HTML 4 процессоры поддерживают UTF-8, и все процессоры HTML5 и XML поддерживают как UTF-8 и UTF-16.

Для более близкого взгляда, пожалуйста , изучить наш полный ISO-8859-1 Reference .


В HTML5: Unicode UTF-8

Поскольку наборы символов, перечисленные выше, ограничены, и не совместимы в многоязычной среде, Консорциум Unicode разработал стандарт Unicode.

В Unicode Стандартные крышки (почти) все символы, знаки препинания и символы в мире.

Unicode позволяет обрабатывать, хранение и транспортировка текста, независимо от платформы и языка.

Кодировка символов по умолчанию в HTML5 является UTF-8.

Для более близкого взгляда, пожалуйста , изучить наш Complete Reference Unicode .