Лаб. 3 Дослідження сучаних методів стискання повідомлень
Методичні вказівки до виконання лабораторної роботи №3
з курсу «Теорія інформації та кодування»


Шаблон оформлення звіту можна одержати тут.
Комплект матеріалів до виконання роботи (демо-програми, приклади повідомлень для дослідження) можна скачати звідсіля.

Мета роботи:
- закріпити знання про сучасні методи стискання без втрат та із втратами інформації;
- оцінити ефективність стискання повідомлень різних типів за результатами дослідження.


Короткі теоретичні відомості
В сучасній практиці широко використовується стискання повідомлень універсальними методами за допомогою програм архіваторів. Таке стискання найбільш ефективно для текстових, числових та змішаних даних, передача яких на припускає втрат інформації. Напроти, для ефективного стискання повідомлень, які безпосередньо сприймаються відчуттями людини (звук, зображення та відео) застосовуються здебільшого спеціалізовані методи, які припускають певні втрати якості, отже й інформації. Сучасні архіватори передбачають можливість використання трьох принципово різних універсальних групи методів, які зазвичай називають словниковими, прогнозними та сортувальними. Ці методи розлічаються за показниками щільності та швидкості стискання, але нині їх результати не різняться суттєво. При цьому словникові методи, які забезпечують найбільшу швидкість, зберігають лідерство в популярності. Зокрема, поширений спосіб із «словником, що ковзає», забезпечує стискання в основному за рахунок компактних посилань на ланцюжки знаків, які рані зустрічались в тексті (наприклад, слова). Саме такий принцип застосовується в сучасному алгоритмі LZMA, який буде досліджений в даній роботі.
Детальний опис універсальних методів стискання наведений в лекціях 5 та 6.

Для стискання зображень широко використовуються методи як без втрат інформації, так і з її втратами. Перший напрямок зазвичай передбачає застосування словникового стискання, яке вбудоване в популярні графічні формати (наприклад, tif, gif та png). Значно більшу щільність забезпечують методи стискання із втратами, які зокрема реалізовані в стандартах JPEG та JPEG-2000. Перший із цих методів передбачає розділення зображень на мікроблоки із згладжуванням дрібних деталей всередині їх. При цьому використовується просторове спектральне перетворення, яке дозволяє виділити саме дрібні деталі зображення, а надалі стискати код завдяки квантуванню (огрубленню) спектру із наступним статистичним стиканням. При сильному стисканні це призводить до мозаїчності зображення. Спосіб JPEG-2000 застосовує так зване вейвлетне перетворення, яке візуально відображається як «замилювання» зображення. При сильному стисканні такий підхід краще сприймається зором, але він програє в швидкості.
Опис методів стискання зображень наведений в лекціях 7 та 8.

Стискання звуку також виконується із втратами інформації та без втрат. Перший напрямок представлений популярним стандартом MP3, який забезпечує стискання звуку в 5-10 разів при збереженні досить прийнятної якості. Таке досягається за рахунок спектрального перетворення блоків звукового потоку із наступним квантуванням спектрів та статистичним стисканням. Співвідношення щільності стискання та збереження якості звуку встановлюється користувачем через заданий рівень бітрейту (кбіт/c). При цьому алгоритм передбачає можливість автоматичної адаптації бітрейту з урахуванням властивостей блоків вихідного потоку (так званий режим змінного бітрейт VBR). Стискання звуку без втрат забезпечує значно меншу щільність, однак нині стає популярнішим в міру здешевшання пам'яті. Такий спосіб базується на використанні адаптивно-різницевого кодування (коли замість повної амплітуди семплу кодується значно менша різниця між його прогнозним та фактичним значеннями). Додатково застосовується префіксне кодування зменшених значень по Райсу.
Детальний опис методів стискання звуку наведений в лекції 7.

Зміст роботи
Робота включає три розділи, що присвячені відповідно дослідженню універсальних методів стискання, методів стискання зображень та звуку.

1) Дослідження ефективності стискання за допомогою сучаних архіваторів:
- дослідження ефективності стискання файлів різних типів словниковим методом за допомогою архіватора 7Zip;
* - дослідження порівняльної ефективності основних методів стискання без втрат (7Zip);
* - аналіз механізму словникового стискання за допомого демо-програми LZSS-demo.

2) Дослідження ефективності стискання зображень:
- дослідження ефективності стискання з використанням різних методів на прикладі фото за допомогою переглядача зображень FastStoneViewer;
- аналіз співвідношення щільності стискання та втрат якості для стандартів JPEG та JPEG-2000 (FastStoneViewer);
* - аналіз механізму стискання зображень із втратами в JPEG з використанням демо-програми JPEG-demo.

3) Дослідження ефективності стискання звуку:
- дослідження ефективності стискання методами MP3 та FLAC на прикладі музичного треку за допомогою конвертора форматів FormatFactory;
* - аналіз механізму стискання звуку без втрат з використанням демо-програми SoundCompress-demo.

Порядок виконання роботи
Для підготовки до роботи необхідно:
- ознайомитись із необхідними теоретичними відомостями, зокрема, змістом лекцій 6 - 8 в електронному конспекті на сайті tik-diit.dp.ua;
- скачати архів з методичними матеріалами та файл з шаблоном звіту із сайту та разгорнути його на робочому комп'ютері (подібно до попередньої роботи);
- підготувати файли для дослідження стискання. Зокрема в папки Звук та Зображення (всередині папки Робочі файли) перенести зразки відповідних файлів із лабораторної 1. В папці Текст піготувати набір файлів за зразком (Два файли переносяться із папки Варіанти, а текст лекції береться безпосередньо з сайту і зберігається в форматах .doc та .txt).

1) Дослідження ефективності стискання за допомогою сучаних архіваторів
а) Дослідити ефективність стискання файлів різних типів словниковим методом
- виконати за допомогою архіватора 7Zip за алгоритмом LZMA стискання файлів різних із папки з прикладами;
- відобразити результати дослідження в звіті у вигляді табл.3.1;
- проаналізуйте одержані результати та прокоментуйте їх.

* б) Дослідити порівняльну ефективність основних методів стискання без втрат:
- виконати за допомогою архіватора 7Zip стискання файлів в форматі txt та doc алгоритмами LZMA, PPMd та BZip2
- відобразити результати досліsдження в звіті у вигляді табл.3.2;
- проаналізуйте одержані результати та прокоментуйте їх.

* в) Виконати аналіз механізму словникового стискання за допомого демо-програми LZSS-demo:
- ввести в робоче вікно програми короткий текст, в якому присутні повторювані слова (див. приклад на рис.3.1);
- запустити кодування і переглянути його детальні результати (окремі знаки та посилання на їх повторювані ланцюжки, показники щільності стискання);
- пояснити одержані пошагові результати з позицій розуміння алгоритму стискання;
- скопіювати в робоче вікно додатково повтор вихідного тексту та проаналізувати результати кодування (див. приклад на рис.3.1);
- дослідити вплив обсягу словника та буферу на щільність стискання.

2) Дослідити ефективності стискання зображень різними методами
а) Дослідити ефективність стискання з використанням різних методів на прикладі фото прикладів за допомогою переглядача зображень FastStoneViewer:
- оберіть фото із папки прикладів згідно варіанту;
- виконайте збереження в різних форматах без стискання та із стисканням та відобразіть результати в табл.3.3;
- проаналізуйте результати стискання та відобразіть результати в коментарях до таблиці.

* б) Виконайте аналіз співвідношення щільності стискання та втрат якості для стандартів JPEG та JPEG-2000
- виконайте збереження зображення в форматах JPG та JP2 із значеннями параметру стискання згідно табл.3.4. Відобразіть результати в табл.3.4;
- проаналізуйте результати стискання та відобразіть результати в коментарях до таблиці.

* в) Виконайте аналіз механізму стискання зображень із втратами в JPEG з використанням демо-програми JPEG-demo:
- оберіть для аналізу файл Межі кольрів.bmp та виділіть елемент зображення (мікроблок) із різкою зміною кольорів (режим Прийняти);
- послідовно виконайте спектральне перетворення та квантування спектру (режими Пряме перетворення; Задати ступінь огрублення — прийняти). Збережіть скриншоти із відображенням вихідних та огрублених спектрів для складових колірної моделі YUV;
- відновіть стиснуте зображення (режим Зворотнє перетворення) та збережіть скриншот із відобаженням зміненого мікроблоку;
- скомпонуйте та вставте в звіт рисунок за прикладом рис.3.2.

3) Дослідження ефективності стискання звуку
а) Дослідити ефективність стискання методами MP3, Monkey та FLAC на прикладі музичного треку за допомогою конвертора форматів FormatFactory:
- за допомогою FormatFactory конвертувати звуковий файл із лабораторної роботи 1 із формата mp3 в формат wav. Відобразити результати в табл.3.5;
- послідовно виконати збереження файлу в форматі mp3 із значеннями статичного бітрейту 320 та 256, а також автоматичного змінного бітрейту. Відобразити результати в табл.3.5;
- виконати стискання звукового файлу без втрат методами FLAC та Monkey (відповідно в форматах flac та ape) відобразити в в табл.3.5;
- проаналізувати результати та відобразити коментарі в таблиці.

* б) Виконати аналіз механізму стискання звуку без втрат з використанням демо-програми SoundCompress-demo:
- відкрити текстовий файл sound-output із прикладом послідовності амплітуд семплів та скопіювати з нього блок даних для аналізу стискання звуку;
- запустити файл sound-demo.html та скопіювати блок амплітуд в робоче вікно. Переглянути часові діаграми вихідних звукових коливань і результатів різницевого та прогнозно-різницевого представлення амплітуд. Зберегти скриншот;
- обрати та зафіксувати значення прогнозно-різницевого представлення амплітуди та проаналізувати побудування коду Райса для неї. Зберегти скриншот;
- проаналізувати дані про щільність стискання при різних значеннях параметру алгоритму Райса. Пояснити їх;
- скомпонувати рисунок за зразком рис.3.3 та помістити його в звіт.

Вимоги до виконання роботи, оформлення та захисту звіту
Ті самі, що і для попередньої роботи

Питання для самоконтролю при підготовці до захисту звіту

До розділу 1. Дослідження ефективності стискання за допомогою сучаних архіваторів
1) Які типи повідомлень доцільно стискати за допомогою архіваторів і чому саме.
2) Спираючись на результати дослідження в табл. 3.1, охарактеризуйте ефективність стискання файлів різних типів словниковим методом. * Поясніть причини розбіжностей
3) Дайте стислий огляд напрямків стискання без втрат, які використвуються в сучаних архіваторах. * Поясніть принципи стискання в кожному із зих напрямків.
* 4) Спираючись на результати дослідження в табл. 3.2, співставте ефективність стискання за різними групами методів. Чому словникове стсикання зберігає лідерство в популярності
* 5) Спираючись на рис.3.1, поясніть алгоритм стискання із словником, що ковзає. Поясніть вплив розміру словника та буфера на щільність стискання та його швидкість.

До розділу 2. Дослідження ефективності стискання зображень
1) Дайте стислий огляд сучаних методів стискання зображень та сфер їх використання
2) Поясніть механізм стискання звуку за методом JPEG
3) Спираючись на результати дослідження в табл.3.3, охарактеризуйте щільність стискання зображень різними методами. * Поясніть причини розбіжностей
* 4) Спираючись на результати дослідження в табл.3.4, охарактеризуйте співвідношення стсикання та якості зображень за методами JPEG і JPEG-2000. * Поясніть механізм впливу параметру стискання для обох методів.
* 5) Спираючись на рис.3.2, поясніть алгоритм стискання JPEG.

До розділу 3. Дослідження ефективності стискання звуку
1) Дайте стислий огляд сучаних методів стискання звуку та сфер їх використання
2) Поясніть механізм стискання звуку за методом MP3
3) Спираючись на результати дослідження в табл.3.5, охарактеризуйте щільність стискання звуку різними методами. * Поясніть причини розбіжностей
* 4) Спираючись на рис.3.3, поясніть метод стискання звуку без втрат.
О дисциплине ТИК
Почему «Теория информации и кодирования» - одна из самых интересных дисциплин, которые изучают будущие системщики и защитники информации?

В ней сочетаются золотая классика и самая актуальная современность computer-science.

продолжение
О сайте
Здесь вы найдете материалы, которые помогут в изучении дисциплины “Теория информации и кодирования” (ТИК) в том виде, как она преподается на кафедре ЭВМ ДИИТа.

На сайте размещены методические материалы:
  • электронный конспект лекций;
  • методическое обеспечение к лабораторным работам;
  • полезные ссылки.

продолжение
© 2008-2019 • Теория информации и кодирования
UP