Презентация по информатике на тему: «Измерение информации. Алфавитный подход» 7 класс

В нашей жизни каждый из нас что-то измеряет. Например, в детстве, наши родители измеряли нам высоту нашего тела. Это ведь так увлекательно, когда узнаешь, что всего за один год ты вырос на целых 5 сантиметров! Для этих целей мы использовали линейку и дверной косяк, помечая на нём ежегодно зарубками высоту.

Каждое измерение требует своего прибора и своей единицы измерения.

Так, масса какого-либо тела измеряется весами в килограммах, время при помощи часов в секундах и т.д.

У начинающих изучать информатику, сам собой, возникает вопрос о том, в каких единицах измерять информацию?

Наименьшая единица измерения информации

Для измерения информации в информатике используют свою, особенную единицу измерения. Она получила название — «бит» и образована от словосочетания двух английских слов — «binary digit».

Для того чтобы была возможность измерить информацию необходимо, как вы помните, закодировать информацию в цифровые двоичные данные. Только так, мы сможем узнать размер набора цифровых данных, хранящемся в каком-либо файле.
Бит — наименьшая единица измерения информации.
Это определение означает, что не существует никакой другой единицы измерения информации, которая была бы меньше, по своему значению, чем один бит.

Один бит содержит в себе очень малую часть информации. Ведь он способен принимать только одно из двух определенных значений (1 или 0).

Поэтому, измерять информацию, используя лишь одни биты, крайне неудобно — числа выходят очень большими. Это тоже самое, если бы мы измеряли высоту своего тела в миллиметрах.

Например, для кодирования 1 символа в текст достаточно 8 бит. 8 бит называют байтом.

§4. Измерение информации

Основные темы параграфа:

— алфавитный подход к измерению информации; — алфавит, мощность алфавита; — информационный вес символа; — информационный объем текста; — единицы информации.

Изучаемые вопросы:

— Алфавит, мощность алфавита. — 1 бит – информационный вес символа двоичного алфавита. — N=2b – формула для определения информационного веса символа. — Информационный объём текста — Единицы измерения информации: байт, килобайт, мегабайт, гигабайт.

Материал для углубленного изучения темы «Измерение информации»

Изучаемые вопросы:

— Содержательный подход к измерению информации — Неопределенность знаний — Формула Хартли

Алфавитный подход к измерению информации

А теперь обсудим вопрос о том, как можно измерять информацию. Существует несколько подходов к измерению информации. Здесь мы рассмотрим только один, который называется алфавитным подходом *.

Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Вам хорошо известно, что существуют единицы измерения таких величин, как, например, расстояние, масса, время. Для расстояния — это метр, для массы — грамм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с единицей измерения. —————————— *О другом подходе к измерению информации см. в разделе 1.1 материала для углубленного изучения «Дополнение к главе I».

Сколько раз единица измерения укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя единица измерения.

Алфавит. Мощность алфавита

Под алфавитом некоторого языка мы будем понимать набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.

Полное число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа

При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами 0 и 1. Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.

Используя три двоичные цифры, можно составить 8 различных комбинаций.

Следовательно, если мощность алфавита равна 8, то информационный вес одного символа равен 3 битам.

Четырехзначными двоичными кодами могут быть закодированы все символы 16-символьного алфавита, и т. д.

Найдем зависимость между мощностью алфавита (N) и количеством знаков в коде (b) — разрядностью двоичного кода.

Заметим, что 2 = 21, 4 = 22, 8 = 23, 16 = 24.

В общем виде это записывается следующим образом:

N = 2b.

Разрядность двоичного кода — это и есть информационный вес символа.

Если число N не равно целой степени двойки, то для определения информационного веса символа поступают следующим образом: берется ближайшее к N, большее N значение М, равное двойке в целой степени: N < М = 2b. Получаемое отсюда значение b принимается за информационный вес символа. Например, если N = 12, то М = 16 = 24. Отсюда информационный вес символа из алфавита мощностью 12 равен 4 битам. Иначе говоря, 12 символов алфавита кодируются 4-разрядными двоичными кодами.

Информационный объем текста. Единицы информации

Информационный объем текста складывается из информационных весов составляющих его символов. Например, следующий текст, записанный с помощью двоичного алфавита:

1101001011000101110010101101000111010010

содержит 40 символов, следовательно, его информационный объем равен 40 битам.

Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит, из которого составляется такой «компьютерный текст», содержит 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и пр.

Поскольку 256 = 28, то один символ компьютерного алфавита «весит» 8 битов. Величина, равная восьми битам, называется байтом.

1 байт = 8 битов.

Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.

Например, небольшая книжка, подготовленная с помощью компьютера, содержит 150 страниц. На каждой странице 40 строк, в каждой строке 60 символов (включая пробелы между словами). Значит, страница содержит 40 х 60 = 2400 байтов информации. Для вычисления информационного объема всей книги нужно полученную величину умножить на число страниц:

2400 байтов * 150 = 360 000 байтов.

Уже на таком примере видно, что байт — «мелкая» единица. А представьте, что нужно, например, измерить информационный объем целой библиотеки. В байтах это окажется громадным числом!

Для измерения больших информационных объемов используются более крупные единицы:

1 килобайт = 1 Кб = 210 байтов = 1024 байта

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб

1 терабайт = 1 Тб = 210 Гб = 1024 Гб

Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчитать точнее, то получится:

360 000 : 1024 = 351,5625 Кб.

351,5625 : 1024 = 0,34332275 Мб.

В заключение еще раз обратим внимание на важное свойство рассмотренного здесь алфавитного подхода. При его использовании содержательная сторона текста в учет не берется. Текст, состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объем.

Коротко о главном

Алфавитный подход — это способ измерения информационного объема текста, не связанного с его содержанием.

Алфавит — это вся совокупность символов, используемых в некотором языке для представления информации. Мощность алфавита — это число символов в нем.

1 бит — информационный вес одного символа двухсимвольного алфавита (N = 2).

Информационный вес символа (разрядность двоичного кода) (b) и мощность алфавита (N) связаны формулой: N = 2b.

Если N не равно двойке в целой степени, то находится большее N, ближайшее к N целое число М = 2b (b — целое), и из этого равенства определяется b — информационный вес символа.

Информационный объем текста равен сумме информационных весов всех символов, составляющих текст.

1 байт — информационный вес символа из алфавита мощностью 28 = 256 символов. 1 байт = 8 битов.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.

Вопросы и задания

1. Что такое алфавит?

2. Что такое мощность алфавита?

3. Как определяется информационный объем текста при использовании алфавитного подхода?

4. Текст составлен с использованием алфавита мощностью 64 символа и содержит 100 символов. Каков информационный объем текста?

5. Что такое байт, килобайт, мегабайт, гигабайт, терабайт?

6. Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?

7. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 32 символа, второй — мощностью 64 символа. Во сколько раз различаются информационные объемы этих текстов?

Крупные единицы измерения информации

В связи с этим, в информатике были придуманы более крупные единицы измерения информации, связь между которыми отражена ниже:

Существуют и более крупные единицы информации:

  • 1 Пб =1024 Тб Петабайт (Пбайт)
  • 1 Эб =1024 Пб Эксабайт (Эбайт)
  • 1 Зб =1024 Эб Зеттабайт (Збайт)
  • 1 Йб =1024 Зб Йоттабайт (Йбайт)

Приведем примеры для сравнения разных объёмов оцифрованной текстовой информации.

Один байт занимает символ, введённый нами с клавиатуры.

100 Кбайт занимает снимок в телефоне с низким разрешением.

1 Мбайт — небольшая художественная книга.

Три гигабайт всего лишь 1 час видеозаписи в хорошем качестве.

Один гигабайт текста способен прочитать человек за всю свою жизнь.

Информационный объём текстового сообщения

Как найти, к примеру, информационный объём сообщения «Информатика – главная наука современности». Для этого нужно сосчитать общее количество символов в сообщении (заключено в кавычках), учитывая пробелы между словами (пробел в компьютере тоже символ). Итого, получаем 41 символов или 41 байт.

Предлагаем узнать, сколько информации находится в книге из 100 страниц, если на каждой странице умещается 50 строк, а на каждой строке — 60 символов. 100⋅50⋅60=300 000 символов, что составляет 300 000 байт. Переведём всё в килобайты: 300 000 байт /1024=292,97 Кб. В мегабайтах это будет уже 292,97 Кб /1024=0,29 Мб.

Задачи для по теме Алфавитный подход к измерению информации

Алфавитный подход. Задачи

Задача 1. Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет 1 буква этого алфавита?

Задача 2. Информационный объем одного символа некоторого сообщения из алфавита племени Пульти равен 6 битам. Сколько символов входит в алфавит этого племени, с помощью которого пультяне составили это сообщение?

Задача 3. Сообщение, записанное буквами из 128 – символьного алфавита, содержит 30 символов. Какой объем информации оно несет?

Задача 4. Сообщение, составленное с помощью 32 – символьного алфавита, содержит 80 символов. Другое сообщение составлено с использованием 64 – символьного алфавита и содержит 70 символов. Сравните объемы информации, содержащейся в сообщениях.

Задача 5. Информационное сообщение объемом 4 Кбайта содержит 4096 символов. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

Задача 6. Сколько килобайтов составляет сообщение из 512 символов 16 – символьного алфавита?

Задача 7. Для записи текста использовался 256 – символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?

Задача 8. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?

Задача 9. Пользователь вводит текст с клавиатуры со скоростью 90 знаков в минуту. Какое количество информации будет содержать текст, который он набирал 15 минут (используется компьютерный алфавит)?

Задача 10. Пользователь вводил текст с клавиатуры 10 минут. Какова его скорость ввода информации, если информационный объем полученного текста равен 1 Кбайт?

Задача 11. Исследователь наблюдает изменение параметра, который может принимать одно из семи значений. Значения записываются при помощи минимального количества бит. Исследователь зафиксировал 120 значений. Определите информационный объем результатов наблюдения.

Задача 12. Если каждый символ кодируется двумя байтами, то каков информационный объем следующего предложения в коде Unicode: Сегодня 35 градусов тепла.

Решения задач

Задача 1. Решение: 2 i = N, 2 i = 8, i= 3 бита. Ответ: 3 бита.

Задача 2. Решение: N = 2 i = 26 = 64 символа Ответ: 64 символа.

Задача 3. Дано: N = 128, K = 30 Найти: Iт — ? Решение: 1) Iт = K*I, где I – объем одного символа 2) 2 i = N, 2i= 128, i = 7 бит – объем одного символа 3) Iт = 30*7 = 210 бит – объем всего сообщения. Ответ: 210 бит – объем всего сообщения.

Задача 4. Дано: N1 = 32, K1 = 80, N2 = 64, K2 = 70 Найти: Iт1, Iт2 Решение: 1) Iт = K*I, где I – объем одного символа 2) 2i = N, 2i = 32, i = 5 бит – объем одного символа первого сообщения; 3) 2i = N, 2i = 64, i = 6 бит – объем одного символа второго сообщения; 4) Iт1 = K1 * i = 80 * 5 = 400 бит – объем первого сообщения; 5) Iт2 = K2 * i2 = 70 * 6 = 420 бит – объем второго сообщения; Ответ: во втором сообщении информации больше, чем в первом.

Задача 5. Дано: К = 4096, Iт = 4 Кб Найти: N — ? Решение: 1) N = 2i; 2) Iт = K*I, I = Iт/K = 4*1024*8/4096=8 бит – объем одного символа; 3) N = 28 = 256 символов – мощность алфавита. Ответ: алфавит содержит 256 символов.

Задача 6. Дано: N = 16, К = 500 Найти: Iт — ? Решение: 1) Iт = K*I, неизвестно I; 2) N = 2i, 16 = 2i, i = 4 бита – объем одного символа; 3) Iт = 4 * 512 = 2048 бит – объем всего сообщения; 4) 2048*8/1024 = 16 Кбайт. Ответ: 16 Кбайт объем всего сообщения.

Задача 7. Дано: N = 256, x = 30 – количество строк, y = 70 – количество символов в строке, M = 5 – количество страниц. Найти: Iт = ? Решение: 1) N = 2i, 256 = 2I, i = 8 бит = 1 байт – объем одного символа; 2) K = x*y*M = 30*70*5 = 10500 символов – в тексте; 3) Iт = I*K = 1 * 10500 = 10500 байт = 10 Кбайт – объем всего текста. Ответ: объем всего текста 10 Кбайт.

Задача 8. Дано: Iт = 1125 байтов, x = 25 – количество строк, y = 60 – количество символов в строке, M = 3 – количество страниц. Найти: N — ? Решение: 1) N = 2i, неизвестно I; 2) Iт = K*I, I = Iт/ К; 3) K = x*y*M = 25*60*3 = 4500 символов – в тексте; 4) I = Iт/ К = 1125*8/4500 = 2 бита — объем одного символа; 5) N = 22 = 4 символа – в алфавите. Ответ: в алфавите 4 символа.

Задача 9. Дано: V = 90зн/мин, t = 15мин, N = 256. Найти: Iт = ? Решение: 1) Iт = K*I; 2) K = V * t = 90*15 = 1350 символов содержит текст; 3) N = 2i, 256 = 2i, I = 8 бит = 1 байт – объем одного символа; 4) Iт = 1350 * 1 = 1350 байт = 1,3 Кбайт — объем всего текста. Ответ: текст содержит 1,3 Кбайт информации.

Задача 10. Дано: Iт = 1 Кбайт, t = 10мин. Найти: V = ? Решение: 1) V = K/t, неизвестно К; 2) K = Iт / I, т.к. мощность компьютерного алфавита равна 256, то I = 1 байт. Поэтому К = 1 1024/1 = 1024 символов в тексте. 3) V = 1024/10 = 102 сим/мин. Ответ: скорость ввода текста 102 символа в минуту.

Задача 11. Решение.

Нам известно максимальное количество значений, которые требуется закодировать с помощью одинаково количества знаков алфавита. Это семь. В качестве алфавита используется бит, который может принимать всего два значения (0 и 1). Для определения минимального количества бит,

необходимых для кодирования одного значения, воспользуемся
формулой Хартли.
В какую степень нужно возвести двойку, чтобы получить семерку? Мы знаем, что 22 = 4, а 23 = 8. Следовательно, значение k находится между 2 и 3 и является дробью. Но количество бит не может быть дробным числом. Поэтому в данном случае, для кодирования одного значения требуется
3 бита
.

Поскольку исследователь зафиксировал 120 значений, то общий информационный объем наблюдения равен 3 * 120=360 битам или (360 / 8 =) 45 байтам.

Ответ.
Информационный объем 120 наблюдений, принимаемых семь различных значений, равен 45 байтам.
Задача 12. Решение.

Посчитаем общее количество символов в предложении с учетом пробелов, цифр и знаков препинания. В данном случае, всего 26 символов. Каждый символ кодируется двумя байтами. Значит информационный объем предложения равен 26 * 2 =52 байта или 52 * 8 = 416 бита.

Ответ.
Информационный объем предложения равен 416 бит.

Рейтинг
( 2 оценки, среднее 4.5 из 5 )
Понравилась статья? Поделиться с друзьями:
Для любых предложений по сайту: [email protected]