Кодування та вимірювання інформації



Скачати 48.25 Kb.
Дата конвертації29.12.2016
Розмір48.25 Kb.
Лекція 1.

Кодування та вимірювання інформації




Кодування інформації



Кодування інформації – процес формування певного представлення інформації. В багатьох мовах кодування розуміють як перехід від одного представлення інформації до другого – більш зручного для зберігання, передачі та обробки. Протилежне перетворення називається декодуванням.

Спосіб кодування залежить від мети кодування: скорочення запису, шифрування повідомлення, зручність обробки.

Існує три основні способи кодування інформації:

1. графічний – за допомогою спеціальних малюнків або графіків.

2. числовий – за допомогою чисел.

3. символьний – за допомогою символів такого ж алфавіту, що і вихідний текст.

Повний набір символів, який використовується для кодування тексту, називається алфавітом або азбукою.

Американський художник Морзе придумав свою відому азбуку –знаменитий сигнал SOS (три крапки, три тире, три крапки) врятував немало людей.





А . -

Л .-..

Ц -.-.

Б -…

М --

Ч ---.

В .--

Н -.

Ш ----

Г--.

О ---

Щ --.-

Д -..

П .--.

Ъ .--.-.

Е .

Р .-.

Ы -.--

Ж …-

С …

Ь -..-

З --..

Т -

Э ..-..

И ..

У ..-

Ю ..--

Й .---

Ф ..-.

Я .-.-

К -.-

Х ….



Приклад. Розшифрувати повідомлення на мові азбуки Морзе:

.-/--../-…/..-/-.-/.-

.--/---/.-./--../.

Відповідь:

Символи “–“ і “.” позначають літери відповідно до вказаної таблиці. Значок «/» відповідає за закінчення певної букви.

Перше позначення “. - “ в таблиці означає букву “А”. друга “--..” “З”. третя “-…” “Б”, і так далі в результаті отримає напис

АЗБУКА МОРЗЕ



Вимірювання інформації


Змістовний підхід. Кількість інформації, яка міситься в деякому повідомленні, визначається обсягом знань, що несе це повідомлення людині, яка його одержує.

При змістовному підході можлива якісна оцінка інформації: корисна, байдужа, важлива, шкідлива ... Одну і ту ж інформацію різні люди можуть оцінити по-різному.

Одиниця виміру кількості інформації називається біт. Повідомлення, що зменшує невизначеність знань людини в два рази, несе для нього 1 біт інформації.

Нехай у деякому повідомленні отримується інформація про те, що відублася одна із N рівноймовірних подій (рінвоймовірність означає, що жодне повідомлення не має переваг над іншими). Тоді кількість інформації, закладена в цьому повідомленні - х біт, і число N зв’язане формулою:

2х=N

Дана формула є показниковим рівнянням щодо невідомої х. З математики відомо, що розв’язок такого рівняння має вигляд:

х=log2N
Приклад 1. При киданні монети повідомлення про результат жеребкування (наприклад, випав герб) несе 1 біт інформації, оскільки кількість можливих варіантів результату дорівнює 2 (герб або копійка). Обидва ці варіанти рівноймовірні. Відповідь може бути отримана з розв’язання рівняння:

2х = 2,

звідки, очевидно, випливає: х = 1 біт.

Висновок: у будь-якому випадку повідомлення про одну подію із двох рівноймовірних несе 1 біт інформації.


Приклад 2. В барабані для розігрування лотереї знаходиться 32 кульки. Скільки інформації міститься про перший номер, який випаде (наприклад, випав номер 15)?

Відповідь. Оскільки витягують будь-яку із 32 кульок, то кількість інформації про один номер, який випав, знаходиться із рівняння:

2х = 32.

Отже, х = 5 біт. Очевидно, відповідь не залежить від того, який саме випаде номер.

Алфавітний підхід до зміни інформації дозволяє визначити кількість інформації, яка розміщена в тексті. Алфавітний підхід є об’єктивним – він не залежить від суб’єкта (людини), сприймаючого текст.

Множина символів, які використовуються при записі тексту, називається алфавітом. Повна кількість символів в алфавіті називається потужністю (розміром) алфавіту. Якщо допустити, що всі символи алфавіту зустрічаються в тексті з однаковою частотою, то кількість інформаціїї, що належить кожному символові, обчислюється за формулою:

і=log2N

де N – кількість символів алфавіту.

Отже, у 2-х символьному алфавіті кожен символ має 1 біт (log22=1); у 4-х символьному алфавіті кожен символ має 2 біти інформації (log24=2); у 8-ми символьному - 3 біти (log28=3) і т.д.

Один символ із алфавіту потужністю 256 (28) несе в тексті 8 біт інформації. Така кількість інформації називається байт. Алфавіт із 256 символів використовується для представлення текстів у комп'ютері.

1 байт = 8 біт.

Якщо весь текст складається із К символів, то при алфавітному підході розмір інформації, що утримується в ньому, дорівнює:

І = К* і,

де і - інформаційна вага одного символу у використовуваному алфавіті.

Для вимірювання інформації використовуються і більш великі одиниці:

1 Кбайт (кілобайт) = 210 байт = 1024 байт

1 Мбайт (мегабайт) = 210 Кбайт = 1024 Кбайт

1 Гбайт (гігабайт) = 210 Мбайт = 1024 Мбайт


Приклад 3. Книга, набрана за допомогою комп'ютера, містить 150 сторінок; на кожній сторінці - 40 рядків, у кожнім рядку - 60 символів. Який обсяг інформації в книзі?

Відповідь. Потужність комп'ютерного алфавіту дорівнює 256. Один символ несе 1 байт інформації. Виходить, сторінка містить 40 х 60 = 2400 байт інформації. Обсяг всієї інформації в книзі (у різних одиницях;):

2400 х 150 = 360 000 байт.



360000/1024 = 351,5625 Кбайт

351,5625/1024 = 0,34332275 Мбайт.


База даних захищена авторським правом ©lecture.in.ua 2016
звернутися до адміністрації

    Головна сторінка