1.5.1. Несжатые коды
Если сжимаемые символы являются кодами ASCII, то им можно просто присвоить свои значения для представления в несжатом виде. В общем случае, когда алфавит имеет произвольный размер, несжатые коды двух разных размеров можно также легко построить. Рассмотрим, например, алфавит размера
. Первым 16 символам можно присвоить числа от 0 до 15 в их двоичном разложении. Эти символы потребуют только 4 бита, но мы закодируем их пятью битами. Символам с номерами от 17 до 24 присвоим числа
,
, и до
в двоичном представлении из 4 бит. Итак, мы получим шестнадцать 5-битовых кода 00000, 00001, ... , 01111, за которыми следуют восемь 4-битовых кода 0000, 0001, ... , 0111.
В общем случае, если имеется алфавит
, состоящий из
символов, выбираются такие числа
и
, что
и
. Первые
символов кодируются как
-битовые числа от 0 до
, а остальные символы кодируются
-битовыми последовательностями так, что код символа
равен
. Такие коды называются синфазными двоичными кодами.
Гибель одного человека - это трагедия, а
смерть миллионов людей это статистика.
- Иосиф Сталин