guide
|
On-line учебник
HTML с примерами,
|
guide |
| Главная | Учебник HTML | Учебник CSS | Web- mastering |
| Раскрутка | Полезности | FAQ | Е- mailer |
| Взять banner | bookmark | Контакты | Отослать ссылку |
Все символьные обозначения букв, цифр, специальных знаков и иероглифов на самом деле представляют собой битовые комбинации - различные сочетания битов. Так, например, из 8 битов, в различных комбинациях, теоретически может получиться 256 последовательностей, в свою очередь каждой из этих последовательностей присвоен символ, другими словами из 8 битов может получиться 256 символов. Каждому такому символу присваивается свой код и из них составляется таблица - кодировка символов. Соответственно таких таблиц может быть как минимум по одной на каждый из земных языков. На самом деле их гораздо больше, чем это нужно, все они были созданы в разное время, для различных платформ, и кодируются они не только при помощи 8 битов, но и 16 и даже 32.
Самым популярным из стандартов кодирования символов, в настоящий момент является стандарт ISO 646, созданный международной организацией стандартизации ISO, а точнее его первые 128 символов, которые кодировались при помощи 8 битов, но при этом первый бит всегда равнялся нулю. Ему было присвоено имя ASCII и иногда его еще называют 7-битовым стандартом. Он используется большинством компьютерных машин для написания символов латинского алфавита, а также для синтаксиса всех языков программирования и разметки, а также для всех типов данных.
Для поддержки языков, использующих в своем алфавите символы отличные от латинских, был использован восьмой бит байта, а это дало возможность добавить еще 128 дополнительных символов. Была создана серия кодировок ISO 8859, в которых первая часть - это 128 символов ASCII. Самая первая из них, ISO 8859-1, еще ее называют ISO Latin-1 или 8-битовой ASCII, содержит в себе практически все европейские нестандартные символы, а кодировка ISO 8859-5 является русской.
В свою очередь, организация Unicode Consortium создала на основе 16-битового кодирования одноименную кодировку, в которую решено было вместить 65536 символов, каждый весом в два байта. Первые 256 символов Unicode в точности соответствуют ISO 8859-1, а саму кодировку компьютерное сообщество признало и использует все чаще, и если основной кодировкой в HTML раньше считалась ISO 8859-1, то с появлением HTML 4.0, основной кодировкой стала Unicode.
Не желая останавливаться на достигнутом, ISO разработала новый, 32-битовый стандарт кодирования ISO 10646. Он совместим с Unicode, а также имеет несколько своих производных фоматов, одна из которых - формат UTF-8 внедрен в Windows.
Для нормального отображения символов той или иной кодировки, и сервер, и браузер должны обменяться соответствующей служебной информацией. Для этого протокол HTTP, при помощи поля Accept-Charset, позволяет браузеру послать сообщение на сервер о том, какие кодировки в нем доступны и в каком порядке очередности. При этом сервер может выбрать из вариантов документ, исполненный в требуемой кодировке, сообщить браузеру информацию о том, в какой кодировке будет прислана страница, или автоматически перекодировать ее и переслать браузеру. Если такая возможность не реализована на сервере, то присланный документ можно просмотреть в различных кодировках, выбрав их в настройках браузера вручную.
Еще одним способ сообщить браузеру о стандарте кодирования может сводиться к
следующему - автор документа создает служебную информацию для браузера в тэге
<МЕТА>, между тэгами <HEAD> и </HEAD>,
запись эквивалентную заголовку HTTP, например:
<META HTTP-EQUIV="Content-Type" content="text/html;
charset=UTF-8">
Встретив такую инструкцию,
браузер автоматически переключается на нужную кодировку.
Кодировок, русифицирующих сеть, существует гораздо больше, чем хотелось бы, их как минимум пять: KOI-8 (созданная для UNIX), 866 (для MS DOS), Windows-1251, ISO 8859-5, MAC. Ввиду распространения такого количества русских кодировок, в русской части сети очень распространен способ, когда сервер имеет систему автоматического перекодирования документа на лету, в зависимости от того, какой ответ пришел о браузера.
В итоге, часто происходит например, следующее: документ написан в KOI-8 и имеет об этом запись в тэге <МЕТА>, сервер определяет кодировку браузера Windows-1251 и автоматически перекодирует документ в нее, браузер же получив инструкцию прописанную в тэге <МЕТА> переключается в свою очередь на KOI-8 и пользователь не может прочесть текст. Выход может быть в том, чтобы вовсе не указывать charset в тэге <МЕТА>, в документах, которые будут лежать на таком сервере, либо пользователь сохраняет документ на диске и удаляет эту инструкцию из <МЕТА> вручную.
Иногда web-мастер сталкивается с необходимостью разместить в одном документе текст на двух и более языках. Как правило, это небольшие фрагменты текста, чаще реклама или ссылки, поэтому очень часто их выполняют в виде рисунков экономичного формата .gif Но бывают также случаи, когда на сайте действительно необходимо разместить именно текст. В таком случае можно воспользоваться мнемоническими ссылками на символы Unicode, это значит, что автор использует для создания документа обычную кодировку, а вместо недостающих символов другого языка вставляет их код в таблице Unicode.
Например, если в документ Windows-1251 вставить знак
ö, или ö, то получим символ ö,
применяемый в немецком языке. Этим и объясняется сильное увеличение объема
документа в три-четыре раза, когда для его создания используется
WYSIWYG-редактор, так как он заменяет каждую букву русского текста такой
ссылкой.
Еще один вариант - набрать текст в текстовом процессоре, например в MS
Word, а после сохранить его как файл HTML, при этом кодировку
документу выбрать, скажем UTF-8.
Пример
Ниже приведена таблица наиболее часто встречающихся символов и их
кодов:
| Знак | код | Знак | код | Знак | код | Знак | код | Знак | код | Знак | код | ||||||||||||
| " | " | Œ | Œ | ö | ö | Š | Š | σ | σ | ְ | ְ | ||||||||||||
| # | # | |  | ÷ | ÷ | š | š | τ | τ | ֱ | ֱ | ||||||||||||
| $ | $ | Ž | Ž | ø | ø | Ţ | Ţ | υ | υ | ֲ | ֲ | ||||||||||||
| % | % | |  | ù | ù | ţ | ţ | φ | φ | ֳ | ֳ | ||||||||||||
| & | & | |  | ú | ú | Ť | Ť | χ | χ | ִ | ִ | ||||||||||||
| ' | ' | ‘ | ‘ | û | û | ť | ť | ψ | ψ | ֵ | ֵ | ||||||||||||
| ( | ( | ’ | ’ | ü | ü | Ŧ | Ŧ | ω | ω | ֶ | ֶ | ||||||||||||
| ) | ) | “ | “ | ý | ý | ŧ | ŧ | ϊ | ϊ | ַ | ַ | ||||||||||||
| * | * | ” | ” | þ | þ | Ũ | Ũ | ϋ | ϋ | ָ | ָ | ||||||||||||
| + | + | • | • | ÿ | ÿ | ũ | ũ | ό | ό | ֹ | ֹ | ||||||||||||
| , | , | – | – | Ā | Ā | Ū | Ū | ύ | ύ | ֻ | ֻ | ||||||||||||
| - | - | — | — | ā | ā | ū | ū | ώ | ώ | ּ | ּ | ||||||||||||
| . | . | ˜ | ˜ | Ă | Ă | Ŭ | Ŭ | Ё | Ё | ֽ | ֽ | ||||||||||||
| / | / | ™ | ™ | ă | ă | ŭ | ŭ | Ђ | Ђ | ־ | ־ | ||||||||||||
| 0 | 0 | š | š | Ą | Ą | Ů | Ů | Ѓ | Ѓ | ֿ | ֿ | ||||||||||||
| 1 | 1 | › | › | ą | ą | ů | ů | Є | Є | ׀ | ׀ | ||||||||||||
| 2 | 2 | œ | œ | Ć | Ć | Ű | Ű | Ѕ | Ѕ | ׁ | ׁ | ||||||||||||
| 3 | 3 | |  | ć | ć | ű | ű | І | І | ׂ | ׂ | ||||||||||||
| 4 | 4 | ž | ž | Ĉ | Ĉ | Ų | Ų | Ї | Ї | ׃ | ׃ | ||||||||||||
| 5 | 5 | Ÿ | Ÿ | ĉ | ĉ | ų | ų | Ј | Ј | א | א | ||||||||||||
| 6 | 6 |   | Ċ | Ċ | Ŵ | Ŵ | Љ | Љ | ב | ב | |||||||||||||
| 7 | 7 | ¡ | ¡ | ċ | ċ | ŵ | ŵ | Њ | Њ | ג | ג | ||||||||||||
| 8 | 8 | ¢ | ¢ | Č | Č | Ŷ | Ŷ | Ћ | Ћ | ד | ד | ||||||||||||
| 9 | 9 | £ | £ | č | č | ŷ | ŷ | Ќ | Ќ | ה | ה | ||||||||||||
| : | : | ¤ | ¤ | Ď | Ď | Ÿ | Ÿ | Ў | Ў | ו | ו | ||||||||||||
| ; | ; | ¥ | ¥ | ď | ď | Ź | Ź | Џ | Џ | ז | ז | ||||||||||||
| < | < | ¦ | ¦ | Đ | Đ | ź | ź | А | А | ח | ח | ||||||||||||
| = | = | § | § | đ | đ | Ż | Ż | Б | Б | ט | ט | ||||||||||||
| > | > | ¨ | ¨ | Ē | Ē | ż | ż | В | В | י | י | ||||||||||||
| ? | ? | © | © | ē | ē | Ž | Ž | Г | Г | ך | ך | ||||||||||||
| @ | @ | ª | ª | Ĕ | Ĕ | ž | ž | Д | Д | כ | כ | ||||||||||||
| A | A | « | « | ĕ | ĕ | ſ | ſ | Е | Е | ל | ל | ||||||||||||
| B | B | ¬ | ¬ | Ė | Ė | ƒ | ƒ | Ж | Ж | ם | ם | ||||||||||||
| C | C | | ­ | ė | ė | Ǻ | Ǻ | З | З | מ | מ | ||||||||||||
| D | D | ® | ® | Ę | Ę | ǻ | ǻ | И | И | ן | ן | ||||||||||||
| E | E | ¯ | ¯ | ę | ę | Ǽ | Ǽ | Й | Й | נ | נ | ||||||||||||
| F | F | ° | ° | Ě | Ě | ǽ | ǽ | К | К | ס | ס | ||||||||||||
| G | G | ± | ± | ě | ě | Ǿ | Ǿ | Л | Л | ע | ע | ||||||||||||
| H | H | ² | ² | Ĝ | Ĝ | ǿ | ǿ | М | М | ף | ף | ||||||||||||
| I | I | ³ | ³ | ĝ | ĝ | ˘ | ˘ | Н | Н | פ | פ | ||||||||||||
| J | J | ´ | ´ | Ğ | Ğ | ˙ | ˙ | О | О | ץ | ץ | ||||||||||||
| K | K | µ | µ | ğ | ğ | ˚ | ˚ | П | П | צ | צ | ||||||||||||
| L | L | ¶ | ¶ | Ġ | Ġ | ˛ | ˛ | Р | Р | ק | ק | ||||||||||||
| M | M | · | · | ġ | ġ | ˜ | ˜ | С | С | ר | ר | ||||||||||||
| N | N | ¸ | ¸ | Ģ | Ģ | ˝ | ˝ | Т | Т | ש | ש | ||||||||||||
| O | O | ¹ | ¹ | ģ | ģ | ; | ; | У | У | ת | ת | ||||||||||||
| P | P | º | º | Ĥ | Ĥ | ΄ | ΄ | Ф | Ф | װ | װ | ||||||||||||
| Q | Q | » | » | ĥ | ĥ | ΅ | ΅ | Х | Х | ױ | ױ | ||||||||||||
| R | R | ¼ | ¼ | Ħ | Ħ | Ά | Ά | Ц | Ц | ײ | ײ | ||||||||||||
| S | S | ½ | ½ | ħ | ħ | · | · | Ч | Ч | ׳ | ׳ | ||||||||||||
| T | T | ¾ | ¾ | Ĩ | Ĩ | Έ | Έ | Ш | Ш | ״ | ״ | ||||||||||||
| U | U | ¿ | ¿ | ĩ | ĩ | Ή | Ή | Щ | Щ | ، | ، | ||||||||||||
| V | V | À | À | Ī | Ī | Ί | Ί | Ъ | Ъ | ؛ | ؛ | ||||||||||||
| W | W | Á | Á | ī | ī | Ό | Ό | Ы | Ы | ؟ | ؟ | ||||||||||||
| X | X | Â | Â | Ĭ | Ĭ | Ύ | Ύ | Ь | Ь | ء | ء | ||||||||||||
| Y | Y | Ã | Ã | ĭ | ĭ | Ώ | Ώ | Э | Э | آ | آ | ||||||||||||
| Z | Z | Ä | Ä | Į | Į | ΐ | ΐ | Ю | Ю | أ | أ | ||||||||||||
| [ | [ | Å | Å | į | į | Α | Α | Я | Я | ؤ | ؤ | ||||||||||||
| \ | \ | Æ | Æ | İ | İ | Β | Β | а | а | إ | إ | ||||||||||||
| ] | ] | Ç | Ç | ı | ı | Γ | Γ | б | б | ئ | ئ | ||||||||||||
| ^ | ^ | È | È | IJ | IJ | Δ | Δ | в | в | ا | ا | ||||||||||||
| _ | _ | É | É | ij | ij | Ε | Ε | г | г | ب | ب | ||||||||||||
| ` | ` | Ê | Ê | Ĵ | Ĵ | Ζ | Ζ | д | д | ة | ة | ||||||||||||
| a | a | Ë | Ë | ĵ | ĵ | Η | Η | е | е | ت | ت | ||||||||||||
| b | b | Ì | Ì | Ķ | Ķ | Θ | Θ | ж | ж | ث | ث | ||||||||||||
| c | c | Í | Í | ķ | ķ | Ι | Ι | з | з | ج | ج | ||||||||||||
| d | d | Î | Î | ĸ | ĸ | Κ | Κ | и | и | ح | ح | ||||||||||||
| e | e | Ï | Ï | Ĺ | Ĺ | Λ | Λ | й | й | خ | خ | ||||||||||||
| f | f | Ð | Ð | ĺ | ĺ | Μ | Μ | к | к | د | د | ||||||||||||
| g | g | Ñ | Ñ | Ļ | Ļ | Ν | Ν | л | л | ذ | ذ | ||||||||||||
| h | h | Ò | Ò | ļ | ļ | Ξ | Ξ | м | м | ر | ر | ||||||||||||
| i | i | Ó | Ó | Ľ | Ľ | Ο | Ο | н | н | ز | ز | ||||||||||||
| j | j | Ô | Ô | ľ | ľ | Π | Π | о | о | س | س | ||||||||||||
| k | k | Õ | Õ | Ŀ | Ŀ | Ρ | Ρ | п | п | ش | ش | ||||||||||||
| l | l | Ö | Ö | ŀ | ŀ | Σ | Σ | р | р | ص | ص | ||||||||||||
| m | m | × | × | Ł | Ł | Τ | Τ | с | с | ض | ض | ||||||||||||
| n | n | Ø | Ø | ł | ł | Υ | Υ | т | т | ط | ط | ||||||||||||
| o | o | Ù | Ù | Ń | Ń | Φ | Φ | у | у | ظ | ظ | ||||||||||||
| p | p | Ú | Ú | ń | ń | Χ | Χ | ф | ф | ع | ع | ||||||||||||
| q | q | Û | Û | Ņ | Ņ | Ψ | Ψ | х | х | غ | غ | ||||||||||||
| r | r | Ü | Ü | ņ | ņ | Ω | Ω | ц | ц | ـ | ـ | ||||||||||||
| s | s | Ý | Ý | Ň | Ň | Ϊ | Ϊ | ч | ч | ف | ف | ||||||||||||
| t | t | Þ | Þ | ň | ň | Ϋ | Ϋ | ш | ш | ق | ق | ||||||||||||
| u | u | ß | ß | ʼn | ʼn | ά | ά | щ | щ | ك | ك | ||||||||||||
| v | v | à | à | Ŋ | Ŋ | έ | έ | ъ | ъ | ل | ل | ||||||||||||
| w | w | á | á | ŋ | ŋ | ή | ή | ы | ы | م | م | ||||||||||||
| x | x | â | â | Ō | Ō | ί | ί | ь | ь | ن | ن | ||||||||||||
| y | y | ã | ã | ō | ō | ΰ | ΰ | э | э | ه | ه | ||||||||||||
| z | z | ä | ä | Ŏ | Ŏ | α | α | ю | ю | و | و | ||||||||||||
| { | { | å | å | ŏ | ŏ | β | β | я | я | ى | ى | ||||||||||||
| | | | | æ | æ | Ő | Ő | γ | γ | ё | ё | ي | ي | ||||||||||||
| } | } | ç | ç | ő | ő | δ | δ | ђ | ђ | ً | ً | ||||||||||||
| ~ | ~ | è | è | Œ | Œ | ε | ε | ѓ | ѓ | ٌ | ٌ | ||||||||||||
| |  | é | é | œ | œ | ζ | ζ | є | є | ٍ | ٍ | ||||||||||||
| € | € | ê | ê | Ŕ | Ŕ | η | η | ѕ | ѕ | َ | َ | ||||||||||||
| |  | ë | ë | ŕ | ŕ | θ | θ | і | і | ُ | ُ | ||||||||||||
| ‚ | ‚ | ì | ì | Ŗ | Ŗ | ι | ι | ї | ї | ِ | ِ | ||||||||||||
| ƒ | ƒ | í | í | ŗ | ŗ | κ | κ | ј | ј | ّ | ّ | ||||||||||||
| „ | „ | î | î | Ř | Ř | λ | λ | љ | љ | پ | پ | ||||||||||||
| … | … | ï | ï | ř | ř | μ | μ | њ | њ | چ | چ | ||||||||||||
| † | † | ð | ð | Ś | Ś | ν | ν | ћ | ћ | ژ | ژ | ||||||||||||
| ‡ | ‡ | ñ | ñ | ś | ś | ξ | ξ | ќ | ќ | گ | گ | ||||||||||||
| ˆ | ˆ | ò | ò | Ŝ | Ŝ | ο | ο | ў | ў | ڰ | ڰ | ||||||||||||
| ‰ | ‰ | ó | ó | ŝ | ŝ | π | π | џ | џ | ڱ | ڱ | ||||||||||||
| Š | Š | ô | ô | Ş | Ş | ρ | ρ | Ґ | Ґ | ڲ | ڲ | ||||||||||||
| ‹ | ‹ | õ | õ | ş | ş | ς | ς | ґ | ґ | ڳ | ڳ |