Информатика и ИКТ ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ Ключевые слова • кодовая таблица • восьмиразрядный двоичный код • информационный объём текста Представление текстовой информации в памяти компьютера Текст состоит из символов - букв, цифр, знаков препинания и т. д., которые компьютер различает по их двоичному коду. Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц. Кодовая таблица 0 – 32 - управляющие символы ASCII 33 – 127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций 128 – 256 – буквы национального алфавита Представление текстовой информации в памяти компьютера Коды русскихкодовой букв в разных кодировках Фрагмент таблицы ASCII Символ Десятичный код Двоичный Кодировка Символ Десятичный код код Двоичный код Символ Windows КОИ-8и кодами Соответствие изображениями символов Пробел 32 между 00100000 0 48 00110000 десятичный двоичный 1 десятичный двоичный символов устанавливается кодовых таблиц. ! 33 00100001с помощью 49 00110001 # $А 35 код код 00100011 2 код код 50 00110010 36 192 110000003 00100100 225 51 11100001 00110011 *Б 42 193 00101010 110000014 226 52 00110100 11100010 =В 43 194 00101011 110000105 247 53 00110101 11110111 , 44 00101100 6 54 00110110 - 45 00101101 7 55 00110111 Стандарт кодирования символов Unicode позволяет _ 46 8 56 00111000 пользоваться более чем00101110 двумя языками. / 47 00101111 00111001 В Unicode каждый 9 символ57 кодируется A 65 010000001 78 01001110 шестнадцатиразрядным двоичным Nкодом. Такое количество B 66 01000010 79 010001111 разрядов позволяет закодировать 65O 536 различных символов: 01000011 P 80 01010000 216 =C65 536. 67 Информационный объём фрагмента текста I - информационный объём сообщения Задача 1. Задача Задача 2.3. 4. K – количество символов I=Kxi Автоматическое устройство осуществило перекодировку Выразите в мегабайтах объём текстовой информации Считая, что каждый символ кодируется одним байтом, В кодировке Unicode на каждый символ отводится двав i – информационный вес символа информационного сообщения на русском языке, первоначально «Современном словаре иностранных слов» из 740 страниц, определите, чему равен информационный объём следующего байта. Определите информационный объём слова из 24 записанного в 8-битовом коде, в 16-битовую кодировку Unicode . 80 При если на одной странице размещается в среднем 60 строк по высказывания Жан-Жака Руссо: В зависимости от разрядности используемой кодировки символов в этой кодировке. этом информационное 2048при байтов. Каков символов (включая сообщение пробелы). увеличилось Считайте, начто записи информационный символа текста, создаваемого на Решение. был информационный объём сообщения до перекодировки? Тысячи путей алфавит ведутвес к заблуждению, к символов. истине - только один. использовался мощностью 256 компьютере, может быть равен: Решение. I Решение. = 24 х 2 = 48 (байтов). вес каждого символа в 16-битовой кодировке в два •В Информационный 8данном битов (1 байт)57 - восьмиразрядная тексте символов (с учётом кодировка; знаков препинания и Ответ: Kраза = 740 х48 80байтов. х информационного 60 больше I = K x i веса символа в 8-битовой кодировке. пробелов). Каждый символ исходного кодируется байтом. •NПоэтому 6=битов (2 байта) кодировка. перекодировании блока одним информации из 8256 при N- шестнадцатиразрядная = 2i Следовательно, информационный объём всего текста - 57 битовой кодировки в 16-битовую его информационный объём должен текста - равную это был другими фрагмента словами, на величину, Iбайтов. -Информационный ? увеличиться вдвое, объём исходному информационному объёму. Следовательно, количество битов, байтов (килобайтов, мегабайтов), Ответ: информационный 256 =57 2i байтов. = 28, i объём = 8 сообщения до перекодировки составлял 2048 необходимых для записи фрагмента оговорённым байтов = 2 Кб. К = 740 х 80 х 60 x 8 = 28 416 000 бит = 3 552 000 байтов = кодирования. 3,39 Мбайт. =способом 3 468,75 Кбайт Ответ: 2 Кбайта. Ответ: 3,39 Мбайт. Самое главное Текст состоит из символов - букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц. В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен: • 8 битов (1 байт) - восьмиразрядная кодировка; • 6 битов (2 байта) - шестнадцатиразрядная кодировка. Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования. Вопросы и задания РТ № 196 194 (стр. 84) каждый символ кодируется 8 В кодировке какой ASCII кодировочной таблице можно Сообщение, В Сообщение Почему текстовом кодировки, информационный режиме занимает экран всимвол которых 6информационный страниц монитора объём каждый покоторого 40 компьютера символ строк, равен в Считая, что каждый кодируется одним Считая, что каждый символ кодируется 16 битами, С какой целью была введена кодировка Unicode? закодировать 65 536 различных символов? битами. Определите объём 5 обычно Кбайт, кодируется каждой занимает разбивается строке цепочкой 4 страницы записано на из25восьми строк по по 32 60 по нулей строки, символов. 80следующей символов и единиц, в каждой в байтом, определите, чему равен информационный оцените информационный объем сообщения в этой кодировке: 1) ASCII строке. Информационный из фразы которых Определите называются объём объём иначе повысказывания всего текста, однобайтовыми? 40 символов. сообщения занимающего Сколько равенвесь 28 объём следующего Алексея А.записано С. Пушкина в кодировке Unicode: Длина данного текста 32котором символа. символов 800 байтам. в алфавите Сколько языка, двоичных на разрядов записано было экран монитора, в кодировке Unicode . 2) Windows Толстого: нам дана: Замена счастию она. использовано наэто кодирование сообщение? одного символа? 1)Привычка 32 бита свыше НеКОИ-8 ошибается тот, кто ничего не делает, хотя это и 3) 1) 44 бита 2) 320 битов есть его основная ошибка. 4) Unicode 2) 704 бита 1) битов 3) 512 32 байта 3) 44 байта 2) 4) 608 256 битов байтов 4) 704 байта 3) 8 Кбайт 4) 123 байта Опорный конспект Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц. Информационный вес символа 8 битов ASCII Windows 16 битов КОИ-8 Unicode I=Kxi I - информационный объём сообщения K – количество символов i – информационный вес символа Домашнее задание § 4.6 (стр. 174-180) РТ № 192 - 213 (стр. 84)