Кодирование текста: различия между версиями

2607 байт добавлено ,  11 лет назад
м
откат к Версия от 18:51, 7 января 2008; MaxSem
м (откат к Версия от 18:51, 7 января 2008; MaxSem)
Для кодирования букв и других символов, используемых в печатных документах, необходимо закрепить за каждым символом числовой номер – код.
В англоязычных странах используются 26 прописных и 26 строчных букв (A …о шг Z, a … z), 9 знаков препинания (. , : ! " ; ? ( ) ), пробел, 10 цифр, 5 знаков арифметических действий (+,-,*, /, ^) и специальные символы (№, %, _, #, $, &, >, <, |, \) – всего чуть больше 100 символов. Таким образом, для кодирования этих символов можно ограничиться максимальным 7-разрядным двоичным числом (от 0 до 1111111, в десятичной системе спасибосчисления за информациюот и0 насчётдо этого да будут обновления и знаете я ээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээээ люблю японию127).
 
Первой такой 7-разрядной кодовой таблицей была ASCII (American Standard Code for Information Interchange), опубликованная как стандарт в 1963 г. американской организацией по стандартизации American Standards Association (ASA), которая позднее стала именоваться ANSI (American National Standards Institute, http://www.ansi.org/, поэтому данную кодовую таблицу называют также и ANSI). Таблица содержала 32 кода команд или управляющих символов (от 0 до 31), большая часть которых сегодня не используется, и 95 кодов (от 33 до 127) для различных знаков, достаточных для работы с английскими текстами, как показано на рисуноке 1.1. На рисунке 1.1 символы построчно имеют следующие коды в шестнадцатеричной системе счисления (в скобках – в десятичной):
*1-я строка с 00 по F и далее с 10 по 1F (0 – 15, 16 - 31),
*2-я строка с 20 по 2F и 30 – 3F (32 – 47, 48 - 63),
*3-я строка с 40 по 4F и 50 – 5F (64 – 79, 80 -95),
*4-я строка с 60 по 6F и 70 – 7F (96 – 111, 112 -127).
[[Изображение:image002.gif]]<br />
В данной таблице для преобразования прописных букв в строчные достаточно к коду букву прибавить 32 и наоборот для преобразования строчных в прописные.
В последующем данная таблица ASCII была принята как стандарт ведущими международными организациями по стандартизации:
*ISO/IEC 646:1991 (ISO – http://www.iso.org/ – International Organization for Standardization и IEC – http://www.iec.ch/ – International Electrotechnical Commission – ведущие международные организации по стандартизации, в области электротехники – совместные стандарты),
*ITU-T Recommendation T.50 (09/92) (The International Telecommunication Union – http://www.itu.int/),
*ECMA-6 (European Computer Manufacturers Association).
 
Однако для нашей страны и многих других стран необходимо было добавить в кодовую таблицу символы национальных алфавитов. Для этого было предложено использовать 8-битную кодовую таблицу, которая могла содержать дополнительно ещё 128 символов (с 128 по 255).
 
В дальнейшем был принят стандарт на 8-битную таблицу ASCII – ISO/IEC 8859, в которой первые 128 символов оставались те же, что и в 7-битной таблице, а символы с 128 по 255 отводились для неанглийских символов.
[[Изображение:image003.png]]<br />
Рисунок 1.2. Кодовая таблица ISO 8859-5(коды с 12810 по 25510)<br />
Первые русские ЭВМ использовали 7-битную кодировку симболовсимволов КОИ-7 (Код Обмена Информацией семибитный – рисунок 1.3), в которой присутствовали прописные латинские буквы, а на месте строчных латинских были русские прописные буквы (кириллица).<br />
[[Изображение:image005.png]]<br />
Рисунок 1.3. Таблица символов КОИ-7<br />
401

правка