Тема урока: ДВОИЧНОЕ КОДИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ Образовательные задачи: 1. Ввести понятие кодовой таблицы 2. Освоить способы представления символьной информации в компьютере, познакомить учащихся с символьным алфавитом компьютера. 3. Отработать практические умения и навыки уч-ся по кодированию и декодированию текстов с помощью различных кодовых таблиц. Воспитательные задачи: 1. Содействовать в ходе урока формированию у уч-ся культуры умственного труда 2. Воспитывать у уч-ся веру в себя путём преодоления трудностей в учебной работе. Развивающие задачи: 1. Развитие интеллектуальных качеств личности учащихся. 2. Развитие общеучебных и общекультурных навыков работы с информацией. 3. Формирование устойчивого внимания. 4. Развитие познавательных способностей. 5. Развитие коммуникативных навыков при работе в группах, парах, консультантами. Ход урока. I. II. Организационный момент. Сообщение уч-ся темы, задач (образовательных) и плана проведения урока. Актуализация знаний. Кроссворд с последующей самопроверкой. По горизонтали: 1. Представление информации в виде кода условных обозначений сигналов или знаков. 2. Способ защиты уже закодированной информации от несанкционированного использования. По вертикали: 1. Наименьшая единица количества информации, соответствующая одному разряду двоичного числа. 2. 8 бит. 3. Вид информации. 4. Код, с помощью которого представлена информация в компьютерах. Ответы: По горизонтали: 1. Кодирование 2. Шифрование. По вертикали: 1. Бит. 2. Байт. 3. Текстовая. 4. Двоичный. III. Изучение нового материала. Практические задания на компьютере. 1 . 1 . 2 . 3 . 4 . . . 2 . Задание № 1. Вывод символов по числовому коду Запустить стандартную программу Блокнот. С помощью дополнительной цифровой клавиатуры при нажатой клавише {Alt} ввести число 0224, отпустить клавишу {Alt}. В документе появится символ «а». Повторить процедуру числовых кодов от 0225 до 0233. В документе появится последовательность символов «абвгдежзий» в кодировке Windows (CP1251). Учитель задает учащимся проблемный вопрос: Как вы думаете, почему мы вводим наборы чисел, а на экране появляются символы? После ответа на предыдущий вопрос учитель ставит перед учениками следующий проблемный вопрос: Кодирование символов производится единственным образом или существует несколько кодировок? Чтобы ответить на этот вопрос, выполним еще одно практическое задание. Задание № 2. Запустить стандартную программу Блокнот. С помощью дополнительной цифровой клавиатуры при нажатой клавише {Alt} ввести число 224, отпустить клавишу {Alt}. В документе появится символ «р». Повторить процедуру числовых кодов от 225 до 233. В документе появится последовательность символов «рстуфхчцшщ» в кодировке MS-DOS (CP 866) . Задание № 3. Практическое задание. Определение числового кода символа Запустить текстовый редактор MS Word. Вести команду Вставка – Символ. На экране появится диалоговая панель Символ. Центральную часть диалогового окна занимает таблица символов для определенного шрифта (например, Times New Roman). Символы располагаются последовательно слева направо и построчно, начиная с символа Пробел в левом верхнем углу и кончая буквой «я» в нижнем правом углу таблицы. Выбрать символ и в раскрывающемся списке из: тип кодировки. В текстовом поле Код знака: появится его числовой код. Начиная с конца 60 – х годов, компьютеры стали все больше использоваться для обработки текстовой информации, и в настоящее время большая часть персональных компьютеров в мире занята обработкой именно текстовой информации. Учитель обращает внимание на то, что «текстовая информация» и «символьная информация» используются как синонимы. С точки зрения компьютера текст – это любая последовательность символов из компьютерного алфавита. Совсем не обязательно, чтобы это был текст на одном из естественных языков (русском, английском и др.). Это могут быть химические, математические формулы, номера телефонов, таблицы и пр. Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт, то есть I = 1 байт = 8 битов. Если рассматривать символы как возможные события, то по формуле N = 2 I можно вычислить, какое количество различных символов можно закодировать: N = 2I = 28 = 256. Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертаниям, а компьютер – по их кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в ее двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код импульса). Код символа хранится в оперативной памяти компьютера, где занимает 1 байт. В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, то есть преобразование кода символа в его изображение. Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно. Вывод: В настоящее время существует несколько кодовых таблиц. Поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой, поэтому важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица. Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode, MS-DOS, Macintosh и ISO. В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а N = 216 = 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов. Ученикам раздаются кодовые таблицы. (Приложение 1). Рассмотрим некоторые принципы организации кодовых таблиц. Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.). Символы с номерами от 0 до 31 называют управляющими, символ номер 32 – пробел. Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы. Таблица кодировки символов 128-255 называется кодовой страницей и каждый ее вариант имеет свой номер. Например, в MS DOS используется кодовая страница номер 866, а в Windows – номер 1251. Двоичный код 00000000 ……….. 00001000 ……….. 00001101 ……….. 00100000 00100001 ……….. 01011010 ……….. 01111111 10000000 ……….. 11111111 KOИ8 Десятичный код CP 1251 CP 866 Mac Iso 0 8 Удаление последнего символа (клавиша Backspace) 13 Перевод строки (клавиша Enter) 32 33 Пробел ! 90 Z 127 128 O 255 Ъ ь я А А Нераздел. Нераздел. пробел пробел к п Самостоятельная работа обучающего характера с последующей самопроверкой. Представьте в форме шестнадцатеричного кода слово «ЭВМ» в кодировках КОИ8-Р, CP1251, CP866, Mac, ISO. Воспользуйтесь компьютерным калькулятором и кодовыми таблицами для перевода чисел из десятичной в шестнадцатеричную систему счисления. (В кодировку КОИ8-Р один из учеников переводит, комментируя, у доски, в остальные кодировки самостоятельно). Ответ: Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц: КОИ8-Р: 252 247 237 CP1251: 221 194 204 CP866: 157 130 140 Mac: 157 130 140 ISO: 205 178 188 Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную: КОИ8-Р: FC F7 ED CP1251: DD C2 CC CP866: 9D 82 8C Mac: 9D 82 8C ISO: CD B2 BC Работа с программой-конвертором Для преобразования русскоязычных текстовых документов из одной кодировки в другую используются специальные программы-конверторы. Как правило, эти программы встроены в приложения. Одной из таких программ является текстовый редактор Hieroglyph, который позволяет осуществлять перевод набранного текста из одной кодировки в другую и даже использовать различные кодировки в одном тексте. Практическое задание. (Данное практическое здание в классе, где большинство уч-ся имеют низкий уровень реальных учебных возможностей можно не проводить). Представить в пяти различных кодировках слово «Кодировка». Выполним это задание с использованием текстового редактора Hieroglyph. Перекодирование текста. 1 2 3 4 Запустить текстовый редактор Hieroglyph. В раскрывающемся списке исходных кодировок выбрать кодировку WIN(cp1251) и ввести текст: «Кодировка Windows CP1251». Скопировать текст четыре раза и, выделяя строки, последовательно выбрать в раскрывающемся списке конечные кодировки (DOS, KOI8-R, Mac и ISO), каждый раз нажимая кнопку перекодирования. Для каждой кодировки отредактировать ее название. В результате текст будет состоять из пяти строк, записанных в различных кодировках. IV.Закрепление пройденного материала. (Работа в группах). (Если класс достаточно быстро справляется с освоением нового материала, то закрепление пройденного материала проводится при помощи работы в группах, иначе эту форму работы можно перенести на следующий урок в качестве проверки домашнего задания (см. Приложение 2)). РАБОТА В ГРУППАХ. Учащиеся делятся на две команды. Двое учащихся назначаются консультантами, которые будут проверять и оценивать выполненные задания команд. 1. Задание. Вставьте в текст недостающие слова. ОБРАЗЕЦ ТЕКСТА Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до … или соответствующий ему двоичный код от … до …. Длина кода одного символа равна … бит. Тексты, созданные в одной кодировке, … правильно отображаться в другой. (Ответ: Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Длина кода одного символа равна 8 бит). Консультанты проверяют и оценивают работу. За правильно выполненное задание команда получает 4 очка. Если допущена одна ошибка – 3 очка. Если две ошибки – 2 очка. Если три ошибки – 1 очко. Если 4 ошибки – 0 очков. 2. Задание. С помощью дополнительной цифровой клавиатуры при нажатой клавише ALT ввести данные числа. (После набора комбинации из трех цифр клавишу ALT отпускать). В документе появится высказывание в кодировке MS-DOS (CP866). Постановка задачи: декодировать высказывание и определить его информационный объем. Командам раздаются карточки с закодированными сообщениями. Та команда, которая первая правильно декодировала текст, получает 4 очка. Второй команде начисляются очки в зависимости от количества декодированного текста. Ответы: 1 команда. Машина никогда не сможет делать того, что ей поручает человек, чего он сам не умеет делать. (Ада Лавлейс) 2 команда. Любая машина стоит лишь столько, сколько стоит человек, который на ней работает. (Н. Винер – автор книг «Творец и робот», «Кибернетика и общество», монографии «Кибернетика или управление и связь в животном и машине»). 1 команда. Первая часть высказывания. 172 160 232 168 173 160 032 173 168 170 174 163 164 160 032 173 165 032 1команда. Вторая часть высказывания. 225 172 174 166 165 226 032 164 165 171 160 226 032 226 236 032 226 174 163 174 032 1команда. Третья часть высказывания. 231 226 174 032 165 169 032 175 174 224 227 231 160 165 226 032 231 165 1команда. Четвертая часть высказывания. 171 174 162 165 170 032 231 165 163 174 032 174 173 032 1команда. Пятая часть высказывания. 225 160 172 032 173 165 032 227 172 165 165 226 032 164 165 171 160 226 236 2 команда. Первая часть высказывания. 171 238 161 160 239 032 172 160 232 168 173 160 032 225 226 174 168 226 032 2 команда. Вторая часть высказывания. 171 168 232 236 032 225 226 174 171 236 170 174 032 225 170 174 171 236 2 команда. Третья часть высказывания. 170 174 225 226 174 168 226 032 231 165 171 174 162 165 170 032 170 174 226 2 команда. Четвертая часть высказывания 174 224 235 169 032 173 160 032 173 165 169 032 224 160 161 2 команда. Пятая часть высказывания 174 226 160 165 226 032 250 130 168 173 165 224 3. Задание (это задание является проверкой домашнего задания). Заполнить таблицу, записав положительные числа в прямом, а отрицательные десятичные числа в прямом, обратном и дополнительном кодах в 16-ти разрядном представлении: 1 команда Десятичные числа 20 -60 10 500 -13 -19 Прямой код Обратный код Дополнительный код Прямой код Обратный код Дополнительный код 2 команда Десятичные числа -10 60 -500 -20 9 19 Количество чисел должно соответствовать количеству игроков в команде. За правильно выполненное задание команда получает 5 очков. Если допущена одна ошибка – 4 очка. Если две ошибки – 3 очка. Если три ошибки – 2 очка. Если 4 ошибки – 1 очко. Ответы: 1 команда. Десятичные Прямой код Обратный код Дополнительный числа код 20 0000000000010100 -60 0000000000111100 1111111111000011 1111111111000100 10 0000000000001010 500 0000000111110100 -13 000000000001101 1111111111110010 1111111111110011 -19 0000000000010011 1111111111101100 1111111111101101 2 команда. Десятичные Прямой код Обратный код числа -10 0000000000001010 1111111111110101 60 0000000000111100 -500 0000000111110100 1111111000001011 Дополнительный код 1111111111110110 1111111000001100 -20 13 19 0000000000010100 1111111111101011 000000000001101 0000000000010011 1111111111101100 V. Подведение итогов урока (фронтальный опрос). 1) Какое количество символов включает в себя алфавит компьютера? (256 символов, международный стандарт Unicode включает в себя 65536 различных символов). 2) Какое количество памяти занимает каждый символ? (каждый символ занимает 1 байт памяти, а в Unicode - 2 байта). 3) В текстовом режиме экран обычно разбивается на 25 строк по 80 символов в строке. Определите объем текстовой информации, занимающей весь экран монитора. (Ответ: 25 80 = 2000 байт). 4) Во сколько раз уменьшится информационный объем страницы текста при его преобразовании из кодировки Unicode (таблица кодировки содержит 65536 символов) в кодировку Windows CP1251(таблица кодировки содержит 256 символов)? (В два раза). 5) Каков информационный объем текста, содержащего слово ИНФОРМАТИКА, в 8ми битной кодировке? в 16-битной кодировке? (Ответ: 11 байт, 22 байта). VI. Домашнее задание (Международная кодировка ASCII дана в «Практикуме по информатике и информационным технологиям» Угринович Н.Д.) 1. Закодируйте с помощью таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты: a) Password; б) Windows; в) Norton Commander. 2. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом: а) 54 6F 72 6Е 61 64 6F; б) 49 20 6С 6F 76 65 20 79 6F 75; в) 32 2А 78 2В 79 3D 30. Ответы: 1. a) 50 61 73 73 77 6F 72 64; б) 57 69 6E 64 6F 77 73; в) 4E 6F 72 74 6F 6E 20 43 6F 6D 6D 61 6E 64 65 72. 2. а) Tornado; б) I love you; в) 2*X+Y=0. Формы обучения: общеклассные, групповые. Методы: словесные, практические, методы самостоятельной работы. Формы работы: лекция, комментированное решение у доски, самостоятельная работа обучающего характера с последующей самопроверкой, фронтальный опрос, актуализирующий кроссворд. Приложение 1. (Раздается ученикам) Кодовые таблицы 1. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам). Международная кодировка ASCII 2. Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX. Кодировка KOI8-R 3. Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница"). Кодировка Windows (CP 1251) 4. От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка CP866. Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac. Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5. Кодировка ISO 8859-5 (ISO) Macintosh (Mac) MS-DOS (CP 866)