процесс предоставления информации в виде кода называется
Кодирование информации. Коды. Системы кодирования
Урок 4. Информатика 8 класс
В данный момент вы не можете посмотреть или раздать видеоурок ученикам
Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.
Получите невероятные возможности
Конспект урока «Кодирование информации. Коды. Системы кодирования»
Для обмена информацией с другими людьми человек использует естественные и формальные языки. Представление информации с помощью какого-либо языка часто называют кодированием.
Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.
Код состоит из определенного количества знаков, т. е. имеет определенную длину.
Количество знаков в коде называется длиной кода.
В процессе обмена информацией между людьми часто приходится переходить от одной формы представления информации к другой. Так, в процессе чтения вслух производится переход от письменной формы представления информации к устной и, наоборот, в процессе диктанта или записи объяснения учителя происходит переход от устной формы к письменной. В процессе преобразования информации из одной формы представления в другую происходит перекодирование информации.
Информация может быть представлена в форме числа, текста, графики или звука.
Средством перекодирования служит таблица соответствия знаковых систем (таблица перекодировки), которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
Чаще всего кодированию подвергаются тексты на естественных языках. Существуют 3 основных способа кодирования текста:
Полный набор символов, используемый для кодирования текста, называется алфавитом или азбукой.
Рассмотрим некоторые способы кодирования.
1. Кодированием информации с помощью букв русского алфавита. Суть этого способа заключается в том, чтобы каждую букву сообщения заменить ее номером в алфавите.
2. Флажковая азбука. При помощи этой азбуки осуществляется передача и прием сообщений между судами и кораблями в пределах прямой видимости. Здесь, каждой букве соответствует определенный флаг.
Информация кодируется тремя «буквами»:
· длинный сигнал (тире),
· короткий сигнал (точка),
· отсутствие сигнала (пауза) для разделения букв.
Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.
4. Шифр Цезаря. Этот шифр реализует следующее преобразование текста: каждая буква исходного текста заменяется третьей после нее буквой в алфавите, которая считается написанным по кругу.
5. Перевод чисел из одной системы счисления в другую.
Пусть требуется перевести двоичное число в десятичную систему счисления.
Чтобы осуществлять перевод из двоичной системы счисления в десятичную, следует для начала пронумеровать разряды исходного числа справа налево, начиная с нуля.
Запишем число в виде многочлена, состоящего из произведений цифр числа и соответствующей степени числа 2:
И вычислив по правилам десятичной арифметики, получили число 232.
Пусть теперь требуется перевести двоичное число в восьмеричную систему счисления. Для этого следует разбить это двоичное число на триады, начиная с младшего бита.
Если старшая триада не заполнена до конца, как в нашем случае, следует дописать в ее старшие разряды нули. После этого необходимо заменить двоичные триады, начиная с младшей, на числа, равные им в восьмеричной системе. Это числа: 4, 7, 6, 6, 4, 5, 5, 2.
Таким образом, наше двоичное число запишется в виде:
Аналогично поступаем при переводе чисел из двоичной системы счисления в шестнадцатеричную, но разбиение двоичного числа производим на тетрады. Для примера будем использовать то же двоичное число, что и при переводе в восьмеричную систему счисления.
Заменяя двоичные тетрады на их шестнадцатеричные значения, то есть на C, B, D, C, 6, 5, получим искомое шестнадцатеричное число:
А теперь давайте мы попробуем перевести число 158 из десятичной в двоичную систему счисления. Для этого нужно выполнить последовательное деление нацело числа 158 на основании новой системы счисления, то есть на 2. Получим:
Далее число 79 делим на 2. Аналогичные действия выполняем до тех пор, пока частное не станет равным единице.
Затем запишем остатки от деления в обратном порядке, заменив их цифрами новой системы счисления, т.е. получили число 11101000.
При переводе числа из шестнадцатеричной системы счисления в двоичную, необходимо только заменить каждую цифру шестнадцатеричного числа ее эквивалентом в двоичной системе счисления (используя таблицу соответствия). И не забываем, что каждое шестнадцатеричное число следует заменять двоичным, дополняя его до 4 разрядов (в сторону старших разрядов).
Пусть требуется перевести шестнадцатеричное число F1 в двоичное число. Воспользовавшись таблицей соответствия, получим:
F соответствуют четыре единицы в двоичной системе счисления, а 1 соответствует такая запись 0, 0, 0, 1 в двоичной системе счисления.
Итак, число F1 в двоичной системе счисления запишется так 11110001.
Пусть теперь нам нужно перевести число F1 из шестнадцатеричной системы счисления в восьмеричную. Обычно при таком переводе чисел вначале шестнадцатеричное число переводят в двоичное, затем разбивают его на триады, начиная с младшего бита, а потом заменяют триады соответствующими им эквивалентами в восьмеричной системе. В итоге у на получится, что исходному числу в восьмеричной системе счисления соответствует число 361.
Представление информации. Языки. Кодирование
Урок 2. Информатика 10 класс (ФГОС)
В данный момент вы не можете посмотреть или раздать видеоурок ученикам
Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.
Получите невероятные возможности
Конспект урока «Представление информации. Языки. Кодирование»
В повседневной жизни мы воспринимаем информацию как обмен сообщениями между людьми. Обмениваться сообщениями человек может устно, письменно, с помощью технических средств, отправляя смс или электронные сообщения. Возможно, в будущем человек сможет обмениваться сообщениями с помощью телепатии.
Если вспомнить уроки истории и биологии, то вы поймёте, что своё развитие человек получил благодаря развитию речи, только когда появились и распространились языки.
На сегодняшний момент существует несколько предположений о том, как появились языки, но ни одно из предположений не имеет подтверждения. В начале 21 века были получены данные, после которых ряд учёных предположил, что развитие языка произошло из-за мутации некоторых генов у человека, благодаря чему человек стал отличаться от близких ему приматов. Эта мутация, возможно, произошла от какого-то космического облучения. Конечно, это просто гипотеза и доверять ей беспрекословно нельзя.
Язык – это сложная знаковая система для представления и передачи информации.
Языки бывают естественные, которые развились на определённой территории и принадлежат определённой группе людей. Например, русский язык, английский, китайский, японский, немецкий и другие языки.
Так же выделяют формальные языки: к ним относится математическая символика, языки программирования, система дорожных знаков и другие.
И искусственно созданные языки, например, азбука Морзе и жестовый язык глухих людей.
Основная функция языка – передача информации и её хранение.
Чтобы сохранить информацию её необходимо записать на определённый носитель. Благодаря этому можно передать информацию следующему поколению.
Давайте подумаем, записав текст на русском языке на бумагу используя русский алфавит, что мы сделаем? Мы представим информацию в закодированном виде. Так как используя графические символы (буквы) мы представили текст в виде кода, заключающего в себе содержание речи, то есть информацию.
Таким образом, Кодирование – это процесс представления информации, удобный для её хранения и/или передачи.
Схематически эти два процесса можно представить следующим образом:
Данная схема будет свойственна для всех процессов, связанных с передачей информации.
Теперь давайте выделим некоторые способы и основные цели кодирования.
Способов кодирования существует огромное множество. Даже записав русский текст, используя латинский алфавит мы получим туже информацию, но закодированную иначе. Кстати, очень часто данный способ используют для отправки сообщения, если в данный момент на клавиатуре нет русских букв. Например, фразу: Добрался отлично! можно написать с помощью латинских букв Dobralsya otlichno.
Также есть такой способ кодирования как стенография – это быстрый способ записи устной речи. Данный способ кодирования был необходим во времена отсутствия звукозаписи. Стенографией владели лишь немногие специально обученные люди. Стенографисты успевали записывать текст синхронно с речью выступающего человека. В стенограмме один символ означает целое слово или сочетание букв. Но расшифровать (декодировать) стенограмму мог только сам стенографист.
Как вы уже поняли, закодировать одну и туже информацию можно используя различные способы. И выбор способа кодировки зависит от следующих причин:
· Способа обработки информации.
Остановимся подробнее на способе обработки информации.
Например, используя русский алфавит запишем число «сорок два». А теперь запишем это же число, используя алфавит арабской десятичной системы счисления – 42. Теперь представим, что вам необходимо произвести вычисления. Как будет удобнее? Сорок два умножить на триста восемьдесят шесть. Или используя арабские цифры и знаки действий?
Очевидно, что в данном случае, второй способ удобнее.
В программировании используются различные формальные языки, их называют языками программирования. Например, такие как Pascal, Java, С++, Visual Basic и другие.
Существуют ситуации, когда необходимо засекретить информацию, то есть защитить её от несанкционированного доступа. Тогда информация шифруется. В давние времена шифрование называлось тайнописью.
Шифрование – это процесс кодирования засекреченным способом открытого текса в зашифрованный, известный только отправителю и получателю сообщения.
Дешифрование – процесс обратного преобразования (восстановления) исходных данных. Наука, которая занимается методами шифрования, называется криптография.
Есть очень интересная книга, про способы шифрования. Она называется «Цифровая крепость», автор — Дэн Браун. Если у вас будет желание, обязательно прочтите её.
Теоретически можно разгадать любой шифр. Для успешной расшифровки необходимо научиться пользоваться логикой.
Простейшие примеры логических выводов могут выглядеть так.
Если текст засекречен с помощью подстановочного шифра.
Первые шесть букв послания стоят перед восклицательным знаком, логично предположить, что это обращение «Привет!». Или если в тексте есть слово из двух букв, то почти наверняка это будет предлог или местоимение. И так далее.
Конечно, это логика простейшего примера. При более сложных вариантах шифрования важна собственная интуиция, чтобы с помощью шестого чувства догадаться, какой же метод был применён.
Проблема в том, что алгоритмов шифрования существует бесчисленное множество, к тому же могут применяться комбинации подходов, что значительно усложняет задачу.
Тогда к основным целям кодирования информации относятся: засекречивание информации, быстрый способ записи, передача по техническим каналам связи, выполнение математических вычислений.
Рассмотрим примеры шифрования.
Возможно, самая известная история, основанная на расшифровке тайного послания с помощью логических размышлений и догадок, описана в рассказе «Пляшущие человечки» английского писателя Артура Конана Дойля о сыщике Шерлоке Холмсе.
Как вы помните, к Шерлоку Холмсу обращается за помощью некий мистер Хилтон Кьюбит. Год назад он женился на мисс Илси Патрик, а месяц назад его жена получила письмо из Америки и после прочтения, сразу уничтожила его.
Вскоре возле дома мистера Кьюбита стали появляться рисунки пляшущих человечков. Когда миссис Кьюбит увидела их впервые, она потеряла сознание. Не в силах разгадать загадку самостоятельно, Мистер Хилтон обращается за помощью к прославленному сыщику.
Конечно, Мистер Холмс сразу догадывается, что это не просто детские каракули, а не что иное, как шифр. Накопив достаточное количество пляшущих человечков, Холмс раскрывает их тайну и отправляет телеграмму.
Давайте посмотрим, как Шерлок Холмс расшифровал записку.
Холмс предположил, что во второй и в третьей записке, первое слово — это обращение к миссис Кьюбит, ИЛСИ. Таким образом он получил три буквы — И, Л, С.
Затем, обратил внимание на второе слово третьей записки. Оно состоит из семи букв, также в нём третья и последняя буквы — И. Из предположений о возможном смысле записи следовало, что это слово ПРИХОДИ. Так он получил еще пять букв: П, э, Х, О, Д.
По мнению Холмса, четвёртую записку написала миссис Кьюбит. Записка состояла из всего одного слова, включающего буквы И, О, Д. То есть это может быть слово НИКОГДА. Шерлок получил буквы: Н, К, Г, А.
Размышляя таким образом в руках у Холмса оказались 23 буквы, и он расшифровал все записки.
Или ещё один из самых простых и наиболее широко известных методов шифрования – это Шифр Цезаря, также известный как шифр сдвига, код Цезаря или сдвиг Цезаря.
Шифр Цезаря — это вид шифра подстановки, в котором каждый символ в открытом тексте заменяется символом, находящимся на некотором постоянном числе позиций левее или правее него в алфавите. Например, в шифре со сдвигом вправо на три, буква А была бы заменена на Г, буква Б станет Д, и так далее.
Этот шифр назван в честь римского императора Гая Юлия Цезаря, использовавшего его для секретной переписки со своими генералами.
Различные системы безопасности на протяжении многих веков использовали идею Цезаря и её обобщение в виде аффинного шифра. В настоящее время любой шифр, в котором каждая буква исходного сообщения заменяется на другую букву, сдвинутую на фиксированное число позиций (не обязательно три), называется шифром Цезаря.
Язык – это сложная знаковая система для представления и передачи информации. Языки бывают естественные и искусственно созданные.
Основная функция любого языка – передача и хранение информации.
Существуют ситуации, когда необходимо засекретить информацию, то есть защитить её от несанкционированного доступа. Тогда информация шифруется.
Дешифрование – это процесс обратного преобразования исходного текста.
К основным целям кодирования информации относятся: засекречивание информации, быстрый способ записи, передача по техническим каналам связи, выполнение математических вычислений.
Кодирование информации
Код — система условных знаков (символов) для передачи, обработки и хранения информации (сообщения).
Кодирование — процесс представления информации (сообщения) в виде кода.
Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.
Научные основы кодирования были описаны К.Шенноном, который исследовал процессы передачи информации по техническим каналам связи (теория связи, теория кодирования). При таком подходе кодирование понимается в более узком смысле: как переход от представления информации в одной символьной системе к представлению в другой символьной системе. Например, преобразование письменного русского текста в код азбуки Морзе для передачи его по телеграфной связи или радиосвязи. Такое кодирование связано с потребностью приспособить код к используемым техническим средствам работы с информацией (см. “Передача информации”).
Декодирование — процесс обратного преобразования кода к форме исходной символьной системы, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке.
В более широком смысле декодирование — это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение — это декодирование.
Цели кодирования и способы кодирования
Способ кодирования одного и того же сообщения может быть разным. Например, русский текст мы привыкли записывать с помощью русского алфавита. Но то же самое можно сделать, используя английский алфавит. Иногда так приходится поступать, посылая SMS по мобильному телефону, на котором нет русских букв, или отправляя электронное письмо на русском языке из-за границы, если на компьютере нет русифицированного программного обеспечения. Например, фразу: “Здравствуй, дорогой Саша!” приходится писать так: “Zdravstvui, dorogoi Sasha!”.
Существуют и другие способы кодирования речи. Например, стенография — быстрый способ записи устной речи. Ею владеют лишь немногие специально обученные люди — стенографисты. Стенографист успевает записывать текст синхронно с речью говорящего человека. В стенограмме один значок обозначал целое слово или словосочетание. Расшифровать (декодировать) стенограмму может только стенографист.
Приведенные примеры иллюстрируют следующее важное правило: для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Если надо записать текст в темпе речи — используем стенографию; если надо передать текст за границу — используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, — записываем его по правилам грамматики русского языка.
Еще одно важное обстоятельство: выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки. Покажем это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число “тридцать пять”. Используя же алфавит арабской десятичной системы счисления, пишем: “35”. Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: “тридцать пять умножить на сто двадцать семь” или “35 х 127”? Очевидно — вторая.
Однако если важно сохранить число без искажения, то его лучше записать в текстовой форме. Например, в денежных документах часто сумму записывают в текстовой форме: “триста семьдесят пять руб.” вместо “375 руб.”. Во втором случае искажение одной цифры изменит все значение. При использовании текстовой формы даже грамматические ошибки могут не изменить смысла. Например, малограмотный человек написал: “Тристо семдесять пят руб.”. Однако смысл сохранился.
В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью. Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование — процесс обратного преобразования, при котором восстанавливается исходный текст. Шифрование — это тоже кодирование, но с засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука под названием криптография (см. “Криптография”).
История технических способов кодирования информации
С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования. Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в 1837 году американцем Сэмюэлем Морзе. Телеграфное сообщение — это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату. Эти технические обстоятельства привели С.Морзе к идее использования всего двух видов сигналов — короткого и длинного — для кодирования сообщения, передаваемого по линиям телеграфной связи.
Сэмюэль Финли Бриз Морзе (1791–1872), США
Такой способ кодирования получил название азбуки Морзе. В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами — отсутствием сигналов.
Самым знаменитым телеграфным сообщением является сигнал бедствия “SOS” (Save Our Souls — спасите наши души). Вот как он выглядит в коде азбуки Морзе, применяемом к английскому алфавиту:
Три точки (буква S), три тире (буква О), три точки (буква S). Две паузы отделяют буквы друг от друга.
На рисунке показана азбука Морзе применительно к русскому алфавиту. Специальных знаков препинания не было. Их записывали словами: “тчк” — точка, “зпт” — запятая и т.п.
Характерной особенностью азбуки Морзе является переменная длина кода разных букв, поэтому код Морзе называют неравномерным кодом. Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы “Е” — одна точка, а код твердого знака состоит из шести знаков. Это сделано для того, чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, т.к. в нем используется три знака: точка, тире, пропуск.
Равномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце XIX века. В нем использовалось всего два разных вида сигналов. Не важно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. Длина кода всех символов одинаковая и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов — это знак текста. Поэтому пропуск не нужен.
Жан Морис Эмиль Бодо (1845–1903), Франция
Код Бодо — это первый в истории техники способ двоичного кодирования информации. Благодаря этой идее удалось создать буквопечатающий телеграфный аппарат, имеющий вид пишущей машинки. Нажатие на клавишу с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передается по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.
В современных компьютерах для кодирования текстов также применяется равномерный двоичный код (см. “Системы кодирования текста”).
Методические рекомендации
Тема кодирования информации может быть представлена в учебной программе на всех этапах изучения информатики в школе.
В пропедевтическом курсе ученикам чаще предлагаются задачи, не связанные с компьютерным кодированием данных и носящие, в некотором смысле, игровую форму. Например, на основании кодовой таблицы азбуки Морзе можно предлагать как задачи кодирования (закодировать русский текст с помощью азбуки Морзе), так и декодирования (расшифровать текст, закодированный с помощью азбуки Морзе).
Выполнение таких заданий можно интерпретировать как работу шифровальщика, предлагая различные несложные ключи шифрования. Например, буквенно-цифровой, заменяя каждую букву ее порядковым номером в алфавите. Кроме того, для полноценного кодирования текста в алфавит следует внести знаки препинания и другие символы. Предложите ученикам придумать способ для отличия строчных букв от прописных.
При выполнении таких заданий следует обратить внимание учеников на то, что необходим разделительный символ — пробел, поскольку код оказывается неравномерным: какие-то буквы шифруются одной цифрой, какие-то — двумя.
Предложите ученикам подумать о том, как можно обойтись без разделения букв в коде. Эти размышления должны привести к идее равномерного кода, в котором каждый символ кодируется двумя десятичными цифрами: А — 01, Б — 02 и т.д.
Подборки задач на кодирование и шифрование информации имеются в ряде учебных пособий для школы [4].
В базовом курсе информатики для основной школы тема кодирования в большей степени связывается с темой представления в компьютере различных типов данных: чисел, текстов, изображения, звука (см. “Информационные технологии” ).
В старших классах в содержании общеобразовательного или элективного курса могут быть подробнее затронуты вопросы, связанные с теорией кодирования, разработанной К.Шенноном в рамках теории информации. Здесь существует целый ряд интересных задач, понимание которых требует повышенного уровня математической и программистской подготовки учащихся. Это проблемы экономного кодирования, универсального алгоритма кодирования, кодирования с исправлением ошибок. Подробно многие из этих вопросов раскрываются в учебном пособии “Математические основы информатики” [1].
1. Андреева Е.В., Босова Л.Л., Фалина И.Н. Математические основы информатики. Элективный курс. М.: БИНОМ. Лаборатория Знаний, 2005.
2. Бешенков С.А., Ракитина Е.А. Информатика. Систематический курс. Учебник для 10-го класса. М.: Лаборатория Базовых Знаний, 2001, 57 с.
3. Винер Н. Кибернетика, или Управление и связь в животном и машине. М.: Советское радио, 1968, 201 с.
4. Информатика. Задачник-практикум в 2 т. / Под ред. И.Г. Семакина, Е.К. Хеннера. Т. 1. М.: БИНОМ. Лаборатория Знаний, 2005.
5. Кузнецов А.А., Бешенков С.А., Ракитина Е.А., Матвеева Н.В., Милохина Л.В. Непрерывный курс информатики (концепция, система модулей, типовая программа). Информатика и образование, № 1, 2005.
6. Математический энциклопедический словарь. Раздел: “Словарь школьной информатики”. М.: Советская энциклопедия, 1988.
7. Фридланд А.Я. Информатика: процессы, системы, ресурсы. М.: БИНОМ. Лаборатория Знаний, 2003.