Лаб. 3 Дослідження сучаcних методів стискання повідомлень
Методичні вказівки до виконання лабораторної роботи №3 з курсу «Теорія інформації та кодування»

Розділ 1. Дослідження універсальних методів стискання без втрат
Розділ 2. Дослідження методів стискання зображень
Розділ 3. Дослідження методів стискання звуку

Мета роботи:
- закріпити знання про сучасні методи стискання без втрат та із втратами інформації;
- оцінити ефективність стискання повідомлень різних типів за результатами дослідження.

Загальна характеристика роботи
Ця робота включає три розділи, що присвячені дослідженню популярних сучасних методів стискання повідомлень. Зокрема в розділі 1 вивчаються універсальні методи стискання без втрат, а в розділах 2 та 3 - методи стискання відповідно зображень та звуку без втрат і з втратами інформації. Для кожного розділу наводиться окремий опис стислих теоретичних відомостей та порядку виконання роботи. Більш повні теоретичні відомості наведені зокрема в електронному конспекті лекції №6 та лекції №7 на сайті tik-diit.dp.ua за поточний рік.

Для виконання роботи студент має обрати його рівень: повний або базовий. Останній варіант суттєво менший за обсягом, але відповідний бал не перевищує 75% від повного. Далі в тексті завдання, які належать тільки повному варіанту, помічені *.

В додатках до цих методичних вказівок можна одержати:
- шаблон оформлення звіту за повним варіантом;
- шаблон оформлення звіту за базовим варіантом;
- матеріали до виконання роботи демо-програми;
- матеріали до виконання роботи зразки файлів за варіантами;
- матеріали до виконання роботи архіватор 7-Zip;
- матеріали до виконання роботи переглядач зображень FastStoneImageViewer.

Виходячи із обмежень на розмір файлів для скочування з цього сайту, програму-конвертор форматів FormatFactory рекомендується скачати із офіцйного сайту.

Розділ 1. Дослідження універсальних методів стискання без втрат

Короткі теоретичні дані до розділу 1

Універсальні методи стискання повідомлень без втрат (рис.1) широко використовуються насамперед в архіваторах. Також вони застосовуються в деяких графічних форматах.

Сучасні рішення зазвичай включають класичне статистичне стискання (зокрема по Хаффману), якому передує різна за напрямками попередня обробка тексту (її характер відображений на рис.1).

Рисунок 1 Огляд універсальних методів стискання без втрат

При дещо відмінному співвідношенні показників щільності стискання, швидкості кодування/декодування та вимог до пам'яті вони досить близькі з позицій користувача. При цьому найбільш популярним традиційно лишається словниковий метод (сімейство алгоритмів LZ*), який зазвичай використовується за замовченням.

Порядок виконання роботи в розділі 1

1.1 Дослідити ефективність стискання файлів різних типів словниковим методом за допомогою програми-архіватора (зокрема 7-Zip). Результати навести в табл.1.1 звіту.
Використати текстовий файл та файл з електронною таблицею із з даними для індивідуальних варіантів. В якості прикладу формату документа використати файл із лекцією з сайту (у відповідності до номеру варіанта). Як приклад зображення застосувати растровий файл із лабораторної №1 при 8-бітному кодуванні кольорів.
Спираючись на одержані результати, сформулювати висновки щодо типового ступеню словникового стискання для файлів різних типів.

1.2 Дослідити порівняльну ефективність універсальних методів стискання без втрат на прикладі файлу формата txt (вибір методу стискання виконується опціонально при створенні архіву). Зокрема виконати стискання методом LZMA (словниковим ), PPMd (прогнозним) та BZip2 (сортувальним) . Результати навести в табл.1.2. Спираючись на результати експериментів та опис в лекції, сформулювати висновки щодо властивостей цих трьох напрямків стискання без втрат.

* 1.3 Проаналізувати механізм словникового стискання в модифікації «із словником, що ковзає» (використовується зокрема в дослідженому методі стискання LZMA) за допомогою демо-програми LZSS-демо. Приклад тестової фрази, що стискається, обрати самостійно. Результати відобразити в звіті скриншотом виконання програми (рис.1.1). Спираючись на результати експериментів та опис метода в лекції, сформулювати висновки щодо механізму стискання «із словником, що ковзає» і напрямках підвищення його ефективності в сучасних версіях.

Розділ 2. Дослідження методів стискання зображень

Короткі теоретичні дані до розділу 2

Для стискання зображень застосовуються методи із втратами та без втрат інформації (і відповідно якості). Стискання без втрат є ефективним головним чином для зображень ділової графіки і тут використвуються стандартні універсальні методи. Для фотореалістичних зображень широко застосовується стискання із втратами (рис.2).

Рисунок 2. Напрямки стискання зображень із втратами якості

Нині найбільш популярними методами стискання із втратами лишаються JPEG та JPEG2000. Обидва вони досягають стискання зображень в десятки разів головним чином жертвуючи дрібними деталями, які не критичні для зору. При цьому JPEG застосовує огрублення мікроблоків зображення, спираючись на спектральні перетворення в його просторовій версії (для високих рівнів стисканні тут проявляється мозаїчність). JPEG2000 виконує обробку зображення вцілому за допомогою так званого вейвлетного перетворення (це проявляється як "розмивання" дрібних деталей). Перевагою JPEG2000 є зокрема можливість стикання без втрат, а його недоліком - меньша швидкість стискання. На практиці класичний метод JPEG лишається більш використовуваним.

Порядок виконання роботи в розділі 2

2.1 Дослідити порівняльну ефективність стискання зображень з використанням різних методів за допомогою програми перегляду зображень (зокрема FastStoneImageViewer). Оцінити стискання на прикладі фото (із роботи №1 ) та діаграми (створити таку в excel). Попередньо перевести обидва зображення в растровий формат bmp (для фото задати розрядність кодування кольорів 24 біти, а для діаграми 8 біт). Порівняти стискання із втратами в форматі jpeg та стискання без втрат в форматі png. Схема експериментів та представлення результатів — згідно табл. 2.1.

2.2 Виконати порівняння стискання зображень із втратами за методами JPEG та JPEG-2000 за допомогою програми перегляду зображень (зокрема FastStoneViewer). Використати схему дослідження, яка відображена в табл.2.2. Спираючись на результати експеріментів та опис в лекції, сформулювати характерні особливості обох методів стискання.

* 2.3 Проаналізувати механізм стискання зображень за методом JPEG, використовуючи демо-програму DCP-demo. Зокрема обрати в програмі мікроблок зображення, виконати для нього пряме спектральне перетворення, застосувати огрублення спектру та відновлення растрової форми зображення завдяки зворотньому DCP. Звернути увагу на зміну спектру при огрубленні та пояснити її вплив на стискання зображення.
* Детально пояснити механізм стискання за методом JPEG, спираючись на рис.2.2. Сформулювати відповідні висновки.

Розділ 3. Дослідження методів стискання звуку

Короткі теоретичні дані до розділу 3

Нині активно використовуються методи стискання звуку із втратами та без втрат. Перші суттєво переважають за щільністю стискання (тут найбільшу популярність має метод mp3), а другі зберігають якість звуку (сюди належать зокрема методи FLAC та Monkey) — рис.3.

Рисунок 3. Напрямки стискання звуку із втратами та без втрат

При стисканні із втратами враховуються особливості слуху людини. Насамперед це ефект маскування частотних складових спектру всередині так званих критичних частотних смуг. Для його використання звуковий потік розбивається на блоки-фрейми, для яких виконуються спектральні перетворення. Такий спосіб також обумовлює можливість перерозподілу коду між сусідніми фреймами (режим змінного бітрейту VBR).
При стисканні без втрат застосовується різницеве кодування стереоканалів, кодування амплітуд "з передбачанням" (яке враховує плавність змін звуку), а також скорочення розрядності для відносно невеликих чисел, які одержуються завдяки попереднім перетворенням (зокрема за методом Райса).

Порядок виконання роботи в розділі 3

3.1 Дослідити ефективність стискання звуку різними методами на прикладі музичного треку із лабораторної №1 за допомогою програми-конвертора файлів (зокрема FormatFactory). Результати навести в табл.3.1.
Зокрема при дослідженні методу mp3 задати бітрейт на рівні 256 кбіт/c (якісний звук) і оцінити режими з постійним та змінним бітрейтом. При дослідженні стискання звуку без втрат використати методи FLAC та Monkey.

* 3.2 Детально розглянути принципи стискання звуку із втратами на прикладі метода mp3, спираючись на рис.3.1. Сформулювати основні особливості такого стискання.

* 3.3 Детально розглянути принципи стискання звуку без втрат за допомогою демо-програми SoundCompress-demo. Зокрема розібрати механізми стискання із використанням різницевого кодування та кодування із передбаченням, а також застосування коду Райса. Відобразити ризультати на скриншоті виконання програми (рис.3.2). Сформулювати основні особливості сучасних методів стискання звуку без втрат інформації.
О дисциплине ТИК
Почему «Теория информации и кодирования» - одна из самых интересных дисциплин, которые изучают будущие системщики и защитники информации?

В ней сочетаются золотая классика и самая актуальная современность computer-science.

продолжение
О сайте
Здесь вы найдете материалы, которые помогут в изучении дисциплины “Теория информации и кодирования” (ТИК) в том виде, как она преподается на кафедре ЭВМ ДИИТа.

На сайте размещены методические материалы:
  • электронный конспект лекций;
  • методическое обеспечение к лабораторным работам;
  • полезные ссылки.

продолжение
© 2008-2020 • Теория информации и кодирования
UP