Архiвацiя файлів. Архіви. Принципи стиснення інформації. Програми для роботи з архівами. Створення та робота з архівами



Скачати 82.34 Kb.
Дата конвертації04.12.2016
Розмір82.34 Kb.
Тема: Архiвацiя файлів. Архіви. Принципи стиснення інформації. Програми для роботи з архівами. Створення та робота з архівами.

Мета: Ввести поняття архівування інформації. Ознайомити учнів з принципами стиснення інформації та найбільш широко вживаними програмами-архіваторами. Навчити створювати архіви та працювати з ними за допомогою програми WinRar.

Розвивати практичні навички роботи з ПК, мишею та клавіатурою. Розвивати увагу, зосередженість. Розвивати логічне мислення, пам’ять.

Виховувати уміння самоконтролю та взаємодопомоги, впевненість у собі в своїх силах.


Тип уроку: лекційо-практичний.
Обладнання та матеріали: підручники та посібники, які використовуються під час вивчення курсу, плакати, ілюстративний матеріал, комп’ютери класу, відповідне програмне забезпечення.

Наочність:

Презентації:  “ Стиснення інформації та програми-архіватори ”


Хід уроку:
I. Організаційний момент

Готовність до уроку учнів;



ІІ. Актуалізація опорних знань, умінь, навичок.

1. Написання самостійної роботи.

1.1 Комп’ютерне тестування учнів з допомогою програми “Test-W”;

1.2 Учні, що залишились, працюють кожен над одним із творчих завдань

(по картках).

ІII. Мотивація навчальної діяльності учнів.

1. Оголошення теми та мети уроку, його ролі в даній темі та курсі інформатики в цілому.

2. Постановка перед дітьми цілі та розкриття методів її досягнення на уроці.

3. Актуалізація нової теми. (фронтальна бесіда)


 Що роблять люди, коли треба багато речей перенести в інше місце і в руки все взяти не можна?

(Складають у сумки та валізи. Упаковують).
 Як можна користуватися упакованими речами, якщо вони потрібні?

(Дістати їх з валізи. Витягнути. Розпакувати.)


 Що робити, коли Вам потрібно багато важливої інформації або комп’ютерну гру записати на компакт-диск, а вона не поміщається?

(Якимось чином її зменшити. Стиснути. Упакувати)

Можна навести переконливий приклад із аркушем паперу, який потрібно помістити в кишеню:

  • один аркуш скласти в шестеро,

  • другий грубо зім’яти, зробити висновок.



ІV. Вивчення нового матеріалу.

1. Архівація та архіватори.

- Архівація (стискання) інформації – це таке кодування інформації, коли закодований варіант займає менше дискової пам’яті, ніж початковий.

- Архіватори – це програми, призначені для стискання інформації та створення файлів-архівів.



Програми-архіватори:

WinRar (Rar), WinZip (Zip), WinArj (Arj), WinAce (Ace), Lha та інші.



Типовими функціями програм-архіваторів є: занесення файлів до архіву, переписування файлів із архіву, вилучення файлів з архіву, перегляд вмісту архіву, перевірка архіву, поновлення вмісту архіву тощо.

Щоб скористатися архівною інформацією, необхідно її розархівувати або, як кажуть, «розпакувати». Для цього використовуються програми-розархіваторu: для кожного архіватора – відповідний розархіватор. Часто архівування і розархівування виконує одна й та програма.



Програми-архіватори відрізняються:

  • форматом архівних файлів,

  • швидкістю роботи,

  • мірою (коефіцієнтом) стиснення записів в архіві,

  • інтерфейсом користувача,

  • операційною системою, під управлінням якої вони працюють.

Якщо розширення архівного файлу, який створюється, не вказано явно, то мається на увазі розширення, яке співпадає з ім’ям програми-архіватора.

Наприклад, файли з розширенням ARJ створюються програмою-архіватором ARJ. Файл із розширенням Rar створюються програмою-архіватором Rar.


2. Методи стискання інформації.

В основі роботи програм-архіваторів лежить процедура пошуку та перекодування однакових фрагментів вмісту файлу.

Наприклад, нехай маємо файл, який містить багато однотипних слів: комп’ютер, комп’ютера, комп’ютерна, комп’ютеризація тощо. Якщо сполучення 9 букв “комп’ютер” замінити простою буквеною комбінацією “чц”, то розглянута система слів перетвориться в систему: “чц”,”чца”,”чцна”,чцізація” тощо. При такий заміні вихідний текст дійсно зменшується. Однак в реальних програмах-архіваторах процедура пошуку та перекодування інформації відбувається значно складніше.

Метод заміни ланцюжків однакових бітів, символів або послідовностей символів одним бітом або послідовністю з коефіцієнтом повторення.


Наприклад:

Послідовність ававававававав - (14 байтів) можна замінити на 7ав - (3 байти).

Послідовність ааааааааа - (9 байтів) можна замінити на 9а - (2 байти).
Існує багато практичних алгоритмів стиснення даних, але всі вони базуються на трьох теоретичних способах зменшення надлишковості даних. Перший спосіб полягає в зміні вмісту даних, другий - у зміні структури даних, а третій - в одночасній зміні як структури, так і вмісту даних.

Якщо при стисненні даних відбувається зміна їх вмісту, то метод стиснення є незворотнім, тобто при відновленні (розархівуванні) даних з архіву не відбувається повне відновлення інформації.

Якщо при стисненні даних відбувається тільки зміна структури даних, то метод стиснення є зворотнім. У цьому випадкові з архіву можна відновити інформацію повністю. Зворотні методи стиснення можна застосовувати до будь-яких типів даних, але вони дають менший ступінь стиснення у порівнянні з незворотними методами стиснення.

Існує багато різних практичних методів стиснення без втрати інформації, які, як правило, мають різну ефективність для різних типів даних та різних обсягів. Однак, в основі цих методів лежать три теоретичних алгоритми:



Алгоритм RLE

В основі алгоритму RLE лежить ідея виявлення послідовностей даних, що повторюються, та заміни цих послідовностей більш простою структурою, в якій вказується код даних та коефіцієнт повторення. Наприклад, нехай задана така послідовність даних, що підлягає стисненню:

1 1 1 1 2 2 3 4 4 4

В алгоритмі RLE пропонується замінити її наступною структурою: 1 4 2 2 3 1 4 3, де перше число кожної пари чисел -це код даних, а друге - коефіцієнт повторення. Якщо для зберігання кожного елементу даних вхідної послідовності відводиться 1 байт, то вся послідовність займатиме 10 байт пам'яті, тоді як вихідна послідовність (стиснений варіант) займатиме 8 байт пам'яті. Найбільша ефективність алгоритму RLE досягається при стисненні графічних даних (особливо для одно тонових фонових зображень).


Алгоритми групи KWE


В основі алгоритму стиснення за ключовими словами покладено принцип кодування лексичних одиниць групами байт фіксованої довжини. Прикладом лексичної одиниці може бути звичайне слово. На практиці, в ролі лексичних одиниць вибираються послідовності символів, що повторюються, які кодуються ланцюжком символів (кодом) меншої довжини. Результат кодування зводиться в таблицю, утворюючи так званий словник.

Існує досить багато реалізацій цього алгоритму, серед яких найбільш поширеними є алгоритм Лемпеля-Зіва (алгоритм LZ) та його модифікація алгоритм Лемпеля-Зіва-Велча (алгоритм LZW). Словником в даному алгоритмі є потенційно нескінченний список фраз. Алгоритм починає роботу з майже пустого словника, що містить тільки один закодований рядок, так званий NULL-рядок. Коли зчитується черговий символ вхідної послідовності даних, він додається до поточного рядка. Процес продовжується доти, поки поточний рядок відповідає якій-небудь фразі з словника. Але рано або пізно поточний рядок перестає відповідати якій-небудь фразі словника. У цей момент, коли поточний рядок являє собою останній збіг зі словником плюс щойно прочитаний символ повідомлення, кодер видає код, що складається з індексу збігу і наступного за ним символа, що порушив збіг рядків. Крім того, нова фраза, що складається з індексу збігу і наступного за ним снмвола, додається в словник. У наступний раз, коли ця фраза з'явиться в повідомленні, вона може бути використана для побудови більш довгої фрази, що підвищує міру стиснення інформації.

Алгоритм LZW побудований навколо таблиці фраз (словника), яка відображає рядки символів стискуваного повідомлення в коди фіксованої довжини. Таблиця володіє так званою властивістю передування, тобто для кожної фрази словника, що складається з деякої фрази w і символа К фраза w також міститься в словнику. Якщо всі частинки словника повністю заповнені кодування перестає бути адаптивним (кодування відбувається виходячи з вже існуючих в словнику фраз).

Алгоритми стиснення цієї групи найефективніші для текстових даних великих обсягів і малоефективні для файлів малих розмірів (за рахунок необхідності зберігання словника).


Алгоритм Хафмана


В основі алгоритму Хафмана лежить ідея кодування бітовими групами. Спочатку проводиться частотний аналіз вхідної послідовності даних, тобто встановлюється частота входження кожного символу, що зустрічається у ній. Після цього символи сортуються по спаданню частоти входження.

Основна ідея полягає в наступному: чим частіше зустрічається символ, тим меншою кількістю біт він кодується. Результат кодування зводиться в словник, що необхідний для декодування.

Розглянемо простий приклад, що ілюструє роботу алгоритму Хафмана. Нехай задано текст, в якому літера 'А' входить 10 разів, літера 'B' - 8 раз, 'C'- 6 разів , 'D' - 5 разів, 'E' і 'F' - по 4 рази. Тоді один з можливих варіантів кодування за алгоритмом Хафмана наведений у таблиці 1.

Таблиця 1.



Символ

Частота входження

Бітовий код

A

10

00

B

8

01

C

6

100

D

5

101

E

4

110

F

4

111

Як видно з таблиці 1, розмір вхідного тексту до стиснення рівний 37 байт, тоді як після стиснення - 93 біт, тобто майже 12 байт (без врахування довжини словника). Коефіцієнт стиснення рівний 32%. Алгоритм Хафмана універсальний, тобто його можна застосовувати для стиснення даних будь-яких типів, але він малоефективний для файлів малих розмірів (за рахунок необхідності зберігання словника).

На практиці програмні засоби стиснення даних синтезують ці три "чистих" алгоритми, оскільки їх ефективність залежить від типу та обсягу даних.

- Коефіцієнт стиснення – співвідношення обсягів стиснутої і початкової інформації. Вимірюється в процентах.


V. Практична робота на ПК по закріпленню нового матеріалу.

1. Створити файл-архів із файла user.doc, що є в папці “АРХІВАЦІЯ” на робочому столі.

2. Розпакувати створений архів на робочий стіл.

3. В папці “АРХІВАЦІЯ” знищити ваш архів.

4. Створити файл-архів із всіх файлів, що є в папці “АРХІВАЦІЯ” на робочому столі.

5. Створити саморозпаковуючий архів із файла user.doc, що є в папці “АРХІВАЦІЯ” на робочому столі.

6. Знищити ваші файли-архіви.

7. Створити багатотомний архів із всіх файлів, що є в папці “АРХІВАЦІЯ” на робочому столі.


VІ. Аналіз та підсумки уроку.

1. Аналізуємо, чи досягнуто поставлену на початку уроку мету. Чи навчилися того, про що планували.

2. Робиться аналіз вивченого матеріалу.
VII. Завдання додому:

Вивчити: конспект.



Підготуватися до Практичної роботи № ___ «Архівація даних»


База даних захищена авторським правом ©lecture.in.ua 2016
звернутися до адміністрації

    Головна сторінка