Аналiз методів стискання коду із втратами інформації
Методичні вказівки до виконання лабораторної роботи №4
з курсу «Теорія інформації та кодування»


Шаблон оформлення звіту можна одержати тут в форматах doc або odt.

Мета роботи:
- закріпити теоретичні знання про сучасні методи стискання із втратами;
- опанувати практичні рішення із компресії повідомлень різних типів;
- оцінити ефективність стискання з використанням популярних алгоритмів.


Короткі теоретичні відомості
Сучасні підходи до стискання з втратами інформації широко використовуються для повідомлень, які орієнтовані на безпосереднє їх сприйняття людиною через органи чуття. Сюди належать насамперед зображення, звук і відео. При цьому головними ресурсом стискання є, з одного боку, внутрішні закономірності повідомлень (наприклад, відносна плавність зміни фону зображення), а з іншого – особливості сприйняття (зокрема, нечутливість до дрібних деталей картинки). Для кожного типу повідомлень застосовуються спеціалізовані методи, але існують і важливі їх спільні риси.

Для стискання зображень із втратами найбільш широко використовуються стандарти JPEG та JPEG-2000. Тут економія досягається найбільше за рахунок огрублення дрібних деталей картинки. При цьому JPEG згладжує зображення всередині маленьких блоків, що може призводити до ефекту мозаїчності. JPEG-2000 обробляє зображення цілком, при цьому деталі візуально «розмиваються». Таке зображення лояльніше сприймається зором, але потребує більше часу на обробку. В обох випадках застосовується математичний апарат, який забезпечує подання зображень у частотній області. Для JPEG це різновид спектрального перетворення Фур'є (дискретне косинус-перетворення ДКП), а для JPEG-2000 — вейвлетне перетворення. Перехід до частотного подання дозволяє розділити обробку фонових складових (низькі частоти) і дрібних деталей (високі частоти). Огрублення останніх дозволяє значно скоротити обсяг коду й при цьому досить лояльно сприймається зором.

Для стискання звуку враховують особливості так званої психоакустичної моделі слуху людини. Основним ресурсом компресії є ефект маскування, коли більш потужні частотні складові пригнічують сприйняття сусідніх частот. Останні у зв'язку з цим можна подавати набагато грубіше для економії обсягу коду. Ефект маскування проявляється в рамках певних «критичних» частотних смуг сприйняття звуку. Таким чином, для ефективного стискання з втратами знову-таки необхідний перехід у частотну область, який зазвичай виконується за рахунок швидких перетворень Фур'є (ШПФ). У популярному стандарті компресії звуку mp3 згаданий підхід доповнюється низкою допоміжних елементів.

При компресії відео стискання окремих кадрів доповнюється використанням інерційності зору при сприйнятті їх послідовності. Зокрема, повні «опорні» кадри, які стиснуті, наприклад, із застосуванням JPEG, чергуються з «прогнозними», у яких кодується тільки інформація про зміни зображення. Широко використовується метод «компенсації руху», коли для блоків зображення, що змінюють своє положення на наступному кадрі, визначаються параметри їх переміщення, виконується прогнозування, а потім кодуються тільки відмінності реального зображення від прогнозного. Такий підхід використаний, зокрема, у популярному форматі mp4. Зауважимо, що відеоповідомлення містить зазвичай візуальну й звукову складові. Відповідно відеофайл є «контейнером», який їх об'єднує.

Опис основних методів компресії з втратами наведено в лекціях 6 і 7.

Зміст роботи

Робота містить три розділи:
- стискання зображень згідно зі стандартами JPEG і JPEG-2000;
- компресія звуку на основі стандарту mp3;
- стискання відеопотоку на прикладі формату mp4.


У розділі 1 аналізується співвідношення ступеня стискання коду та якості одержуваних зображень при використанні JPEG і JPEG-2000. При цьому застосовується програма перегляду зображень FastStone Image Viewer. Для детального аналізу механізмів стискання використовуються програма JPEG-Demo.

У розділі 2 досліджується ефективність стискання mp3 при зменшенні заданого бітрейту. Тут також застосовується програма Format Factory. Для детального аналізу використання ефекту маскування застосовується програма SpecViz, яка відображає результати спектральних перетворень звуку.

У розділі 3 досліджується компресія відеопотоку у форматі mp4. При цьому використовується програма конвертації звукових форматів Format Factory. Додатково аналізується механізм стискання відео з урахуванням інерційності зору.

Порядок виконання

Підготовка до виконання роботи:
1. Ознайомитися з теоретичним матеріалом, використовуючи електронний конспект лекцій 6 і 7 на сайті tik-diit.dp.ua.
2. Закріпити розуміння матеріалу, використовуючи пробне тестування.
3. Завантажити із сайту tik-diit.dp.ua матеріали для виконання лабораторної роботи. В архіві містяться перераховані вище програми.

Виконання розділу 1:
1. Виконати експерименти зі стискання растрових зображенням з попередніх лабораторних робіт, використовуючи програму FastStone Image Viewer і методи JPEG і JPEG-2000. При цьому змінювати налаштування рівня компресії (у режимі «Налагодження»), фіксуючи обсяги збережених файлів і зміни якості зображення. Результати зафіксувати на рис.4.1 та в табл.4.1 звіту (додаток Г). Пояснити їх, виходячи з розуміння алгоритмів стискання.
*Виконати аналіз впливу параметрів стискання по JPEG в програмі FastStone Image Viewer. При заданому рівні стискання виконати експерименти зі збереження файлу з відключенням ряду опцій алгоритму згідно з табл. 4.1 звіту (додаток Г). Пояснити їх, виходячи з розуміння алгоритму стискання.

2. Проаналізувати механізм стискання методом JPEG з використати програми JPEG-Demo (приклад на рис. 4.2):
- для файлу Межі_кольорів.bmp вибрати стандартний блок зображення 8х8 пікселів, всередині якого міститься межа між областями з різними кольорами (кнопка «Прийняти»);
- виконати стискання коду для обраного блока, послідовно використовуючи кнопки «Пряме перетворення (пряме ДКП)», «Прийняти (огрублення спектра)» та «Зворотне перетворення (зворотне ДКП)». Спостерігати візуальне розмивання кольорів у обраному блоці;
- проаналізувати вплив заданого рівня огрублення на спектри блоків та розмивання кольорів.

3*. Детально розібратись із механізмом JPEG, використовуючи матеріал лекції 6.

Виконання розділу 2:
1. Виконати експерименти зі стискання звукових файлів формату mp3 за допомогою програми Format Factory. Дослідити вплив на обсяг підсумкового файлу величини заданого бітрейту, а також параметрів налаштування (частота дискретизації, максимальний рівень гучності, кількість каналів, режим змінного бітрейту VBR). Внести результати до табл. 4.3 звіту (додаток Г). Пояснити їх, виходячи з розуміння алгоритму стискання.

2. Розглянути механізм стискання з втратами в mp3 за допомогою програми SpecViz візуалізації кодування звуку. У ході прослуховування аудіо-треку вибрати блок аудіо з наочним відображенням спектру й зберегти скриншот (рис. 4.3). Пояснити принцип стискання звуку в mp3 з використанням спектральних перетворень.

3*. Виділити на скриншоті критичні частотні смуги, у яких спостерігаються піки спектра сигналу. Пояснити механізм стискання коду, який використовує ефект частотного маскування.

Виконання розділу 3:
1. Виконати експерименти зі стискання відеофайлу формату mp4 за допомогою програми Format Factory. Дослідити вплив на обсяг підсумкового файлу параметрів, що задані при стисканні: бітрейту, розмірів кадру і кількості проходів кодування. Розмістити результати в табл.4.4 звіту (додаток Г). Пояснити їх, виходячи з розуміння алгоритму стискання.

2. Розглянути механізм стискання з втратами в mp4, спираючись на рис. 4.4 із типовою структурою блока кадрів (лекція 7) і пояснити особливості формування прогнозних та інтерполяційних кадрів.

3*. Розібратись з технологією компенсації руху, який використовується для стискання прогнозних кадрів у межах методу mp4.

Запитання та завдання для самоконтролю

До розділу 1
1. За рахунок чого здебільшого виконується стискання коду зображень при використанні стандартів JPEG та JPEG2000?
2. Як проявляються втрати якості зображень при збільшенні стискання коду для методів JPEG та JPEG2000? У чому переваги та недоліки JPEG2000?
3*. Поясніть досліджений вплив параметрів стискання для JPEG.
4. Спираючись на аналіз методу JPEG на базі демопрограми JPEG-Demo, поясніть принцип стискання коду для типового блока зображення..
5*. Спираючись на результати аналізу JPEG-2000 на базі демопрограми JPEG2000-Demo, поясніть принцип поетапного стискання коду зображення.

До розділу 2
1. За рахунок чого здебільшого виконується стискання коду звуку при використанні методу mp3?
2. Поясніть результати дослідження впливу параметрів стискання в mp3.
3. Спираючись на результати аналізу блоків аудіокоду, поясніть принцип стискання з використанням спектральних перетворень.
4*. Спираючись на результати аналізу блоків аудіокоду з урахуванням особливостей психоакустичної моделі, поясніть механізми частотного маскування та режиму VBR.

До розділу 3
1. За рахунок чого в основному виконується стискання коду відео при використанні формату mp4?
2. Поясніть результати дослідження впливу параметрів стискання в mp4.
3. Поясніть типову структуру блока кадрів у mp4 та основні особливості базових, прогнозних та інтерполяційних кадрів.
4*. Поясніть основні особливості методу компенсації руху.
О дисциплине ТИК
Почему «Теория информации и кодирования» - одна из самых интересных дисциплин, которые изучают будущие системщики и защитники информации?

В ней сочетаются золотая классика и самая актуальная современность computer-science.

продолжение
О сайте
Здесь вы найдете материалы, которые помогут в изучении дисциплины “Теория информации и кодирования” (ТИК) в том виде, как она преподается на кафедре ЭВМ ДИИТа.

На сайте размещены методические материалы:
  • электронный конспект лекций;
  • методическое обеспечение к лабораторным работам;
  • полезные ссылки.

продолжение
© 2008-2013 • Теория информации и кодирования
UP