Тема: Сутність стиснення даних. Програми архівації.
Мета навчальна: ознайомити з різними методами стиснення файлів, ознайомити з програмами архіваторами, дати необхідні поняття та визначення для правильної роботи на комп'ютері.
Виховна: виховувати інформаційну культуру учнів, уважність, акуратність, дисциплінованість.
Розвиваюча: розвивати пізнавальний інтерес, самоконтроль, уміння писати конспект.
Об'єкт праці: написання конспекту.
Методи: розповідь, пояснення, бесіда, показ.
Обладнання: дошка, персональний комп'ютер, план-конспект, презентація, тести.
Тип уроку: урок вивчення нового матеріалу.
І. Організаційна частина
1. Привітання (Доброго дня!, Вітаю вас!).
2. Перевірка відсутніх, призначення чергових.
3. Перевірка готовності до уроку (Належна поведінка, зошити, щоденники, ручки).
ІІ. Перевірка домашнього завдання
На минулому уроці ми вчились працювати з антивірусними комплексами, сьогодні ми з вами пригадаємо це, тому виконаємо невеликий тест на 12 питань.
ІІІ. Актуалізація опорних знань,
мотивація пізнавальної діяльності
Запитання: Як ви розумієте поняття архівація? Які програми архіватори вам відомі, для чого вони призначені? Які способи стиснення даних вам відомі? Чи доводилось вам користуватись програмами архіваторами?
Розповідь: З розвитком інформаційних технологій гостро постало питання щодо способів зберігання даних. Починаючи з сорокових років ХХ ст., вченні представляють методи представлення данних, за яких простір на носіях інформації використовувався б економічніше. Результатом цього стала технологія стиснення й архівації данних (з анг. backup). Тому метою нашого уроку буде ознайомлення з різними технологіями стиснення даних та програмами-архіваторами.
IV. Вивчення нового матеріалу
План:
1. Методи стиснення даних без втрат:
а) групове кодування RLE;
б) кодування Хафмана;
в) кодування Лемпеля-Зіва;
2. Завдання архівації
3. Архівні формати і архіватори
4. Програма WinRAR
1. Перш ніж розглядати методи стиснення даних треба визначитись з такими поняттями:
Архівація даних - це злиття кількох файлів чи каталогів до єдиного файлу - архіву. Стиснення даних - це скорочення обсягу вихідних файлів шляхом усунення надлишкової інформації.
Існують методи стиснення інформації без втрат та з втратами.
- Методи стиснення без втрат використовуються при роботі з текстовими і програмними файлами, а також у задачах з криптографії.
- Методи стиснення з втратами для аудіо, відеофайлів та графічних файлів. Вони видаляють інформацію, яка не сприймається людиною або незначно впливає на данні.
Розглянемо методи стисненя інформації без втрат
1.1. Групове кодування RLE (Run Length Encoding) - використовують в основному для архівації графіки.
Суть методу:
Подамо зображення у числовому вигляді як ланцюжок байтів. Замінемо послідовності байтів парою чисел: перше число - представляє колір, друге число - кількість пікселів.
Приклад:
255 255 255 255 128 128 0 0 0 0 0 цей рядок описаний байтами. Після стиснення цей рядок матиме вигляд: 255 4 128 2 0 5. Замість 11 байтів запису цього рядка потрібно буде лише 6. Таке кодування використовується тоді коли є довгі лацюжкі байтів, що повторюються. Якщо нема таких ланцюжків стиснювати цим методом недоцільно, бо стиснений файл може бути більшим ніж оригінал.
1.2. Кодування Хафмана - в основі цього методі лежить той факт, що деякі символи в тексті можуть траплятись частіше, а інші рідше. При кодуванні текстової інформації кожному символу відводится 1 байт.
Хафман запропонував дуже простий спосіб визначення якому символу потрібно призначити певний код.
Приклад:
«ІНФІНІТИВ» 9 літер по 8 біт кожна. Всього 72 біти |
||||
Символ |
Кількість повторень |
Символ |
Код |
Після кодування |
І н ф т и в |
3 2 1 1 1 1 |
І н ф т и в |
11 01 101 001 000 100 |
1101101110 111001000100
Всього 22 біта |
Розглянемо слово «ІНФІНІТИВ» це слово займає 9 байти або 72 біти (=9х8). Частота появи літер у цьому слові така: і-3, н-2, ф-1, т-1, и-1, в-1. Хафман запропонував літерам присвоїти код: і-11, н-01, ф-101, т-001, и-000, в-100. Після кодування слово «ІНФІНІТИВ» записуватиметься 1101101001000100 та матиме довжину 22 біта, отримаємо стиснення слова більш ніж у тричі. У цьому методі код жодного символу не є початком іншого будь-якого символа.
Недоліком методу Хафмана є те, що до закодованого файлу слід додавати таблицю кодування символів (у кожного файла вона своя). Однак, якщо файл великий, наявність таблиці несуттєво вплине на розмір архіву.
1.3. Кодування Лемпеля-Зіва - використовують факт неоднарозового повторення фрагментів тексту, тобто послідовності байтів. Практично всі популярні програми (WinRAR, ZIP), використовують методи Хафмана і Лемпеля Зіва.
Суть методу: у потоці даних відшукують послідовності символів, що повторюються. До архіву додаються не самі послідовності, а посилання у вигляді параметрів: зміщення, довжина.
Приклад:
«ДАВНИМ-ДАВНО» Закодований текст буде виглядати так: «ДАВНИМ-(-7,4)О». Тобто замість повторювальної послідовності «ДАВН», що складається з 4 символів, та починається з 8-ї позиції виконується така підстановка. Відраховується зміщення від поточної позції на 7 знаків вліво (зміщення вліво позначають знаком «-»), та використовується фрагмент із 4 знаків.
2. Завдання архівації:
2.1. Зменшення обсягу файлів - потрібне для економічного використання дискового простору та швидкісної передачі даних з одного комп'ютера на іниший.
2.2. Резервне копіювання - використовується для збереження важливої інформації.
2.3. Архівація при шифруванні даних - дозволяє захистити важливі особисті файли від взлому та використанні стороніми людьми.
3. Архівні формати й архіватори
Для роботи з архівами існують програми які називають архіваторами, ці програми окрім створення архівів також здійснюють стиснення даних. Перші програми архіватори зявились в середині 80-х років. Вони були зорієнтовані на роботу в MS-DOS. Популярні архівні формати того часу біли: ARC, ZIP, LZH, ARJ, ICE тощо. Тогочасні архівні формати дозволяли створювати, переглядати архіви, сортувати в них файли, виводити вміст архіву на екран, знищувати файли в архіві. На сьогоднійший день популярні формати для Windows є ZIP, ARJ, LZH, RAR. Слід окремо розглядати формат RAR, і відповідні архіватори стоворені для цього формату програмістом Євгеном Рошалем. Windows версія цього архіватору дуже зручна для роботи, її інтерфейс схожий на вікно (Провідника), забезпечує високий ступінь стиснення, дозволяє створювати багатотомні та саморозпаковувальні архіви.
4. Програма-архіватор WinRAR
Це потужний архіватор і менеджер архівів, який має зручну графічну оболонку й підтримує технологію Drag and Drop. Програма дозволяє працювати не лише з архівами формату RAR, а також з архівами різних форматів таких як ZIP, ARJ, LZH, CAB.
Основні можливості програми:
4.1. Перегляд і вилучення файлів з архіву
4.2. Архівація файлів
4.3. Додавання файлів до архіву
4.4.Створення багатотомних, саморозпаковних архівів, та архівів що захищенні паролем.
Запускається архів будь яким можливим способом, який передбачений Windows. Якщо піктограми WinRAR нема на робочому столі або на панелі інструментів Windows 98 то найпростіще запустит з головного меню (Пуск/Программы/ WinRAR/ WinRAR.EXE).
V. Закріплення вивченого матеріалу
Питання:
1. Що таке архівація та стиснення даних?
2. Назвіть методи стиснення даних без втрат.
3. У чому полягає ідея кодування файлів за методом Хафмана.
4. Наведіть приклади кодування за методом Лемпеля-Зіва.
5. Назвіть основні задачі кодування.
6. Назвіть сучасні архівні формати.
VI. Повідомлення домашнього завдання
Вивчити конспект, прочитати відповідний параграф з підручника, підготуватись до практичної роботи.
Спробуємо стиснути такий вірш:
- Грицю, Грицю, до роботи!
В гриця порвані чоботи...
- Грицю, Грицю, до телят!
В Гриця ніженьки болять...
Як результати маємо: «-_Грицю,_(-7,6)_до_роботи!/В(-20,5)я_порвані_ч(-24,5).../(-51,19)телят(-50,10)ніженьки_бо(-24,3)ь...»