Алфавитный подход к измерению количества информации ⇐ ПредыдущаяСтр 3 из 3
При определения количества информации с помощью вероятностного подхода количество информации зависит от ее содержания, понятности и новизны. Однако любое техническое устройство не воспринимает содержание информации. Поэтому с этой точки зрения используется другой подход к измерению информации – алфавитный. Предположим, что у нас есть текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью. Множество используемых в тексте символов называется алфавитом. В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки. У алфавита есть размер (полное количество его символов), который называется мощностью алфавита. Обозначим мощность алфавита через N. Тогда воспользуемся формулой для нахождения количества информации из вероятностного подхода: I = log2N. Для расчета количества информации по этой формуле нам необходимо найти мощность алфавита N. Контрольный пример. Найти объем информации, содержащейся в тексте из 3000 символов, и написанном русскими буквами. 1. Найдем мощность алфавита: N = 33 русских прописных буквы + 33 русских строчных буквы + 21 специальный знак = 87 символов. 2. Подставим в формулу и рассчитаем количество информации: I = log287 = 6,4 бита. Такое количество информации – информационный объем – несет один символ в русском тексте. Теперь, чтобы найти количество информации во всем тексте, нужно найти общее количество символов в нем и умножить на информационный объем одного символа. Пусть в тексте 3000 символов. 3. Найдем объем всего текста: 6,4 × 3000 = 19140 бит. Теперь дадим задание переводчику перевести этот текст на немецкий язык. Причем так, чтобы в тексте осталось 3000 символов. Содержание текста при этом осталось точно такое же. Поэтому с точки зрения вероятностного подхода количество информации также не изменится, т. е. новых и понятных знаний не прибавилось и не убавилось. Контрольный пример. Найти количество информации, содержащейся в немецком тексте с таким же количеством символов. 1. Найдем мощность немецкого алфавита: N = 26 немецких прописных буквы + 26 немецких строчных букв + 21 специальный знак = 73 символа. 2. Найдем информационный объем одного символа: I = log273 = 6,1 бит. 3. Найдем объем всего текста: 6,1 × 3000 = 18300 бит. Сравнивая объемы информации русского текста и немецкого, мы видим, что на немецком языке информации меньше, чем на русском. Но ведь содержание не изменилось! Следовательно, при алфавитном подходе к измерению информации ее количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. С точки зрения алфавитного подхода, в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается. Правило для измерения информации с точки зрения алфавитного подхода: 1. Найти мощность алфавита – N. 2. Найти информационный объем одного символа – I = log2N. 3. Найти количество символов в сообщении – K. 4. Найти информационный объем всего сообщения – K × I.. Контрольный пример. Найти информационный объем страницы компьютерного текста. Примечание. В компьютере используется свой алфавит, который содержит 256 символов. 1. Найдем информационный объем одного символа: I = log2N, где N = 256. I = log2256 = 8 бит = 1 байт. 2. Найдем количество символов на странице (примерно, перемножив количество символов в одной строке на количество строк на странице). 40 символов на одной строке × 50 строк на странице = 2000 символов. 3. Найдем информационный объем всей страницы: 1 байт × 2000 символов = 2000 байт. Информационный объем одного символа несет как раз 1 байт информации. Поэтому достаточно подсчитать количество символов в тексте, которое и даст объем текста в байтах. Например, если в тексте 3000 символов, то его информационный объем равен 3000 байтам. Задания 1. Какое количество информации будет получено при отгадывании числа из интервала от 1 до 64; от 1 до 20? 2. Какое количество информации будет получено после первого хода в игре «крестики-нолики» на поле 3 x 3; 4 x 4? 3. Сколько могло произойти событий, если при реализации одного из них получилось 6 бит информации? 4. В коробке лежат кубики: 10 красных, 8 зеленых, 5 желтых, 12 синих. Вычислите вероятность доставания кубика каждого цвета и количество информации, которое при этом будет получено. 5. В коробке лежат 36 кубиков: красные, зеленые, желтые, синие. Сообщение о том, что достали зеленый кубик, несет 3 бита информации. Сколько зеленых кубиков было в коробке. 6. В группе учатся 12 девочек и 8 мальчиков. Какое количество информации несет сообщение, что к доске вызовут девочку; мальчика? 7. Найти объем текста, записанного на языке, алфавит которого содержит 128 символов и 2000 символов в сообщении. 8. Найти информационный объем книги в 130 страниц. 9. Расположите в порядке возрастания: 1 Мбт, 1010 Кбт, 10 000 бит, 1 Гбт, 512 байт. 10. В пропущенные места поставьте знаки сравнения <, >, =: 1 Гбт … 1024 Кбт … 10 000 бит … 1 Мбт … 1024 байт. 4 Контрольные вопросы 1. Какое сообщение называется информативным? 2. Что значит событие равновероятно; неравновероятно? 3. Что такое 1 бит информации? 4. Как определить количество информации для равновероятных событий? 5. Как определить количество информации для неравновероятных событий? 6. В чем заключается алфавитный подход к измерению количества информации
Домашняя работа 1.Установите знаки сравнения ( <, > , = ): 1байт 32бита 4байта 1Мбайт 1024Кбайт 2.Упорядочите по убыванию: 5байт 25бит 1Кбайт 1010байт 3.Упорядочите по возрастанию: 2Мбайта 13байт 48бит 2083Кбайт
4.Книга содержит 100 страниц; на каждой странице по 35 строк, в каждой строке -50 символов. Рассчитать объем информации, содержащийся в книге. 5.Имеется следующая черно-белая картинка. Определите информационный объем этой картинки. 6.В языке племени Мумбо-Юмбо всего 129 разных слов. Сколько бит нужно чтобы закодировать любое из этих слов? 7.Подсчитать, сколько байт информации содержит следующая фраза: «Здравствуйте, ребята! Как у вас дела?» 8.Дана черно-белая картинка. Определите количество информации, содержащейся в картинке. 9.Информационный объем черно-белой картинки равен 6000бит. Какое количество точек содержит картинка
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|