Название

Основные кодировки символов текста веб-страниц.

Из предыдущей заметки вы уже имеете определенное представление о том, что такое кодировка веб-страниц.

Сейчас давайте остановимся на вопросе какие бывают кодировки.

На заре развития компьютерной техники, когда компьютеры были слабые и не было большого объема памяти, кодировки представляли собой таблицу все символы, которой могли быть представлены всеми возможными комбинациями числа в 16-ричной системе счисления (это 1 байт информации) или 256 возможных символов.

По этой причине не было возможности создать единую кодировку для всех языков в мире. Каждая кодировка содержала в себе символы своего национального алфавита.

Для символов латиницы, как правило, использовалась кодировка ASCII.

Вот, как эта таблица выглядит:

800px-ASCII_Code_Chart.svg

Для символов кириллицы были созданы кодировки windows-1251 и KOI8-R. Это произошло из-за того, что этими кодировками занимались сразу несколько фирм, чтобы обеспечить поддержку русского языка для своих компьютеров.

Вот таблица с кодировкой Windows-1251

cp1251

Кодировка KOI8-R:

koi8-ru

При таком разнообразии кодировок, была одна проблема: если текст, который написан кириллицей воспроизвести с помощью кодировки ASCII или любой другой кодировкой, которая не содержит символов кириллицы, появляются кракозябры.

Стоило даже текст на кириллице, который сохранен в кодировке windows-1251 открыть в кодировке KOI8-R, как тут же появлялись проблемы.

Нужно было искать какое-то решение.

С развитием вычислительной мощности компьютеров, стало возможным для кодирования различным символов использовать намного больше единиц информации и решено было создать универсальную кодировку для всех языков в мире. Такой кодировкой стала кодировка UTF (Юникод).

Это огромная таблица, которая содержит более 1 миллиона закодированных символов.

Вот небольшая часть этой таблицы:

utf-8,oechtringen

В настоящее время эта кодировка стала стандартом для всех компьютеров в мире. Юникод содержит не только символы мировых алфавитов, но и различные значки, смайлики и др. символы.

При создании современных веб-страниц, желательно пользоваться именно ей. В этом случае, ваши документы будут более универсальными и будут открываться практически во всех случаях.

А сейчас приступаем к конкретным методам, которые будут позволять менять кодировку наших веб-страниц.

Назад Далее