Кодирование текстовой информации

Чтобы эффективно накапливать, передавать и использовать информацию, ее надо представить в виде цифровых кодов, т.е. различающихся чисел, каждое из которых имеет значение некоторого «кванта» информации (т. е. ее неделимого значения). Эта операция называется кодированием информации.

Рассмотрим кодирование текстовой информации. Как известно, любой текст состоит из отдельных знаков - прежде всего букв и цифр. Совокупность таких знаков образует алфавит языка, а правила применения – синтаксис языка. Для работы с большинством языков (за исключением, возможно, китайского и японского) вполне достаточно двух-трех сотен знаков. Из этих знаков строятся слова, предложения, абзацы и главы текстовых документов.

В цифровых информационных системах и компьютерах каждый знак кодируется некоторым кодом - обычно целым числом от 0 до 255. Таким образом, задается 256 знаков (2 в степени 8). Этого вполне достаточно. 2 в степени 7 даст 128 значений - этого мало, а вот 2 в степени 9 - уже 512 значений. Этого уже много! К тому же число 8 кратно двум, вот почему именно единица памяти байт (28 состояний) стала основной.

Содержание раздела