Лекція 02. Види повідомлень. Оцифровка. Спектральні перетворення
Курс “Теорія інформації та кодування”

Тут ми розглянемо два основних види повідомлень, які виділяє ТІК - дискретні та безперервні. Також ознайомимось із методом переведення безперервних повідомлень в дискретну форму, яка є більш універсальною та пристосована для використання в сучасному інформаційному середовищі. І наостанок розглянемо засади математичного апарату спектральних перетворень Фурьє.

Види повідомлень. Підходи до оцифровки
Вибір параметрів оцифровки
Спектральне подання оцифрованих повідомлень

Види повідомлень. Підходи до оцифровки

Дискретні на безперервні повідомлення

Теорія інформації розділяє всі можливі форми повідомлень на два принципово різних види (рис.2.1):

Рисунок 2.1 Види повідомлень та їх співвідношення

- дискретні повідомлення (такі як текст, числові дані або зміст електроних таблиць і баз даних) є послідовностями знаків. Наприклад, текст є ланцюжком літер та розділових знаків, а числові дані представляються цифрами;

- безперервні повідомлення (такі як зафіксовані значення фізичних величин, звук або відображення довкілля, які сприймають наші почуття) можна представити як безперервні величини або їх залежності від часу та координат в просторі. Наприклад, температура, що зафікована датчиком, може мати будь-яке значення в певному інтервалі (подібно до розташування точки на відрізку лінії); звук можна представити як залежність тиску повітря від часу; статичне відображення — як залежність яскравості кольорів від координат на плоскості, а динамічне відображення — як безперервну зміну кадрів.

Принциповим є те, що будь-яке безперервне повідомлення можна перевести в дискретну форму (інакше кажучи — оцифрувати). При цьому завжди можна відновити безперервну форму вихідного повідомлення із потрібною точністю (тобто оцифровка може бути оберненою).

На практиці ми постійно маємо справу із оцифрованими звуком та зображеннями. Таке перетворення надає важливі зручності, оскільки сучасне цифрове середовище пристосоване саме для збереження та обробки дискретних даних. При цьому точність відтворення обмежується лише можливостями технічних пристроїв і на практиці зазвичай є достатньою для збереження якості сприйняття.

Отже, дискретна форма повідомлень є універсальною. Вона має й інші суттєві переваги: зокрема, зручність для обробки та зберігання, а також стійкість до викривлень.

Надалі ми розглянемо підходи до оцифровки вихідних безперервних повідомлень. Щоб узагальнити такий розгляд, розділимо такі повідомлення за їх мірністю.

Оцифровка одновимірних безперервних величин

Знаним прикладом оцифровки простого безперервного повідомлення може бути вимірювання температури тіла термометром. Подібні повідомлення, які містять окремі значення однієї величини, доречно називати одномірними. Такими є, наприклад, відхилення стрілки класичного годинника - рис.2.2.

Рисунок 2.2 Приклади оцифровки одномірних безперервних величин

Оцифровка одномірної безперервної величини передбачає:
- квантування - заміну її значення на відповідний дискретний рівень (із заданою точністю та у визначеному діапазоні);
- кодування обраного дискретного рівню - його подання у вигляді числа (зокрема у звичних одиницях виміру).


В нашому прикладі із вимірюваннем температури тіла:
- безперервна величина для аналогового термометру - висота стовпчику ртуті, а для цифрового пристрою - рівень сигналу від датчика температури. В даному випадку ця величина може приймати будь-яке значення у встановленому діапазоні температури від 320С до 420С;

- квантування виконується з точністю 0,10С. Отже кількість дискретних рівнів N=(42,0-32,0)/0,1+1 (мінімальному значенню відповідає номер 1). Відповідно номер рівню для конкретного значення температури визначається аналогічно. Наприклад, (36,9-32,0)/0,1+1=50. При цьому правило вибору відповідного рівню може встановлюватись з округленням до меньшого, більшого або найближчого дискретного значення;

- кодування для аналогового пристрою безпосередньо використовує звичне подання температури в градусах за Цельсієм та в десятковій системі (наприклад, 36,90С). В цифрових приладах рівні квантованої величини кодуються їх номерами в двійковій системі. Зокрема в нашому прикладі номер рівню для температури 36,90С в двійковому поданні буде 110010 (в байтовому форматі 00110010). Саме в такому вигляді коди зберігаються в пам'яті, а вже при видачі на індикацію одержують потрібну форму знаків.

Узагальнюючи аналіз прикладу, відзначимо наступне:
- при квантуванні відстань між сусідніми дискретними рівнями (крок квантування) зазвичай береться постійною. Це рішення не завжди здається оптимальним (наприклад, нерідко буває зручно, коли точність оцінювання величини задається в %). Але вимоги простоти та стандартізації обумовили саме такий підхід;

- при кодуванні довжина коду Lk має зростати при розширенні діапазону або підвищенні точності квантування (в обох випадках пропорційно зростає потрібна кількість дискретних рівнів N). Однак це обмеження не є суттєвим, оскільки ємність коду Nk швидко зростає із збільшенням його довжини (зрозуміло, що необхідно Nk>=N). Зокрема Nk = 2Lk, отже тільки на один додатковий розряд коду дає збільшення його ємності вдвічі;

- квантування та кодування в комплексі зазвичай реалізуються аналого-цифровими перетворювачами (АЦП). На вхід АЦП подається рівень напруги, що відображує безперервну величину, а на виході формується відповідний двійковий код. АЦП нині існують як окремі мікросхеми або стандартні вузли більш складних мікросхем. Для конкретної мікросхеми задані максимальна розрядність коду Lk та діапазон вхідної напруги, для якої виконується перетворення. Разом ці параметри визначають точність квантування.

Відновлення вихідної безперервної величини за її дискретним значенням зазвичай забезпечується цифро-аналоговими перетворювачами (ЦАП). На вхід ЦАП поступає двійковий код квантованої величини, а на виході одержується відповідне значення напруги. Таке відновлення завжди відбувається із похибками в межах кроку квантування, але вони зазвичай не є суттєвими для практики. Розрядність та діапазон ЦАП погоджуються із відповідним АЦП.

Оцифровка двомірної безперервної залежністі

Оцифровку двомірної безперервної залежністі розглянемо на прикладі звука. Тут маємо залежність безперервного фізичного параметру (зокрема, електричної напруги u на виході мікрофону) від також безперервного часу t. Приклад такої залежності наведений на рис.2.3.

Відзначимо, що математично безперервній функції u(t) еквівалентна будь-яка безперервна функція у(x), тобто її незалежним аргументом може бути не тільки час, а й наприклад оцифровка графіку функції. Але на практиці залежності саме від часу розглядаються найчастіше.

Рисунок 2.3 Оцифровка двомірної безперервної залежності (на прикладі звуку)

Оцифровка двомірної безперервної величини включає:
- дискретизацію за незалежним аргументом (зокрема в часі). Тут вихідна залежність перетворюється на послідовність відліків амплітуди;
- квантування та кодування для відліків амплітуди. Це відбувається за правилами, які описані в попередньому параграфі.


Зокрема для оцифровки звуку результатом дискретизації за часом буде перехід від амплітуди звукової хвилі u(t) до послідовності її фіксованих безперервних значень u(i), а результатом квантування за рівнем — дискретні значення u*(i) амплітуд, які зазвичай кодуються в двійковій формі — рис.2.3.

Як і у випадку квантування, при дискретизації відстань між сусідніми значеннями аргументу (крок дискретизації Δt) зазвичай береться постійною. Відповідно розглядається параметр частоти дискретизації fd=1/Δt (Гц). Альтернативою могло б бути використання змінного кроку, який повинен зростати із збільшенням швидкості зміни амплітуди. Однак вибір робиться в напрямку простоти і стандартизації технічної реалізації.

Далі проблема полягає в адекватному виборі частоти дискретизації. Зростання такої частоти призводить до пропорційного збільшення обсягу коду, а надмірне зменшення може викликати викривлення відновленого повідомлення. Здається, що вибір частоти повинен спиратись на компроміс між точністю і обсягом коду, але в практиці застосовується інший підхід.

Теорія дозволяє визначити оптимальне значення частоти дискретизації, яке є мінімально достатнім для точного наступного відтворення вихідного безперервного повідомлення u(t) по його дискретних значеннях u(i). При цьому враховується максимальна швидкість зміни амплітуди (або її еквівалент - максимальна частота fmax, про яку уже йшлося рані). Надалі ми розглянемо це важливе питання докладніше.

В результаті відновлення двомірної безперервної залежності одержується ступінчаста функція (рис.2.3). Похибки, які визначаються кроком квантування за часом та за рівнем амплітуди на практиці не впливаються суттєво на якість відновленого звуку, разом з тим ступінчастий характер залежності погіршує сприйняття. Щоб усунути такі "сходинки" і наблизити форму віднолевної залежності до вихідної зазвичай використовуються засоби згладжування.

Оцифровка трьохмірної та чотирьохмірної безперервної залежності

Найбільш використовуваним випадком оцифровки трьохмірної та чотирьохмірної безперервної залежності є відповідно статичні та динамічні зображення. Надалі розглнемо саме їх — рис.2.4.

Оцифровка зображень включає наступні етапи:
- дискретизація за координатами на площині статичного зображення (два виміри). В результаті такої дискретизації одержуємо матрицю точкових елементів зображення - растр;
- квантування та кодування рівню яскравості для кожного елемента (третій вимір). Для кольорових зображень таке квантування виконується окремо для кожної складової кольору - зазвичай їх три;
- дискретизація за часом (додатково у випадку динамічних зображень). В результаті безперервний в часі потік пере
творюється на послідовність статичних кадрів (четвертий вимір).

Рисунок 2.4 Оцифрування статичних та динамічних зображень

Дискретизація зображень за координатами на площині характеризується наступним:

- дискретизація за координатами (X, Y) на площині дає прямокутну матрицю точкових елементів зображення — растр. Кожний такий елемент піксель характеризується певним кольором, а для монохромних зображень - рівнем яскравності;

- технічний спосіб одержання растру — фіксація яскравості ділянок зображення світлочутливими елементами. Використвуються два знаних підходи - або одномоментна фіксація матрицею елементів (в фотографії), або поступове переміщення лінійки таких елементів по зображенню (при скануванні);

- щільність растру на відміну від оцифровки звуку визначається не частотними характеристиками вихідної величини (в даному разі це швидкість зміни яскравості), а технічними обмеженнями (головним чином роздільною здатністю апаратури). Основними параметрами растру є його габарити (зокрема нині типові значення біля 3000х2000 пікселів).

Квантування та кодування яскравості пікселів має наступні особливості:
- для монохромних зображень відображається рівень яскравості від 0 (відсутня) до максиального (зокрема 255 при кодуванні одним байтом);
- для кольорових зображень воно виконується окремо для кожної із складових кольору (зазвичай їх три);
- точність квантування зазвичай обмежується довжиною коду (зокрема поширені варіанти 2, 16, 256 та біля 16 мільйонів відтінків відповідно для довжини коду 1, 4, 8 та 24 біти).

Дискретизація динамічних зображень за часом характеризується наступним:
- дискретизація реализується періодичною зміною статичних кадрів. Такий спосіб був винайдений ще при створенні перших кінофільмів;
- частота зміни кадрів в силу високої інерційності зору зазвичай є невисокою (зокрема 24 кадри/c). Це на кілька порядків нижчою від такої частоти для звуку.

Вибір параметрів оцифровки

Вибір розрядності коду рівнів квантування

Додатково упорядкуємо уявлення про вибір розрядності кодування квантованих рівнів безперервних величин — рис.2.5. При цьому використаємо числовий приклад.

Рисунок 2.5 До вибору розрядності кодування рівнів квантування

а) Нехай діапазон зміни безперервної величини u(t) складає від -4 до 4, а потрібна точність визначається квантом 0,02. Звідсіля потрібна кількість рівнів дискретизації відповідно формулі на рис.2.6 складає N(потр)=(4 -(-4))/0,02+1=401;

б) З іншого боку можлива кількість закодованих рівнів N(код) обмежується довжиною відповідного коду K. Зокрема для двійкового кодування N(код)=2K. Таким чином вибір довжини коду повинен враховувати умови N(код) >= N(потр). Для нашого прикладу мінімальне значення N(код), яке відповідає такій умові, складає 29=512. Відзначимо, що додавання кожного розряду коду здатне або розширити вдвічі діапазон параметру, або вдвічі зменшити крок квантування;

в) На практиці квантування безперервного параметру виконується стандартними мікросхемами аналого-цифрових перетворювачів — АЦП. Такі перетворювачі формують двійковий код, що відповідає рівню вхідного параметру (в формі напруги). При цьому поширені АЦП, які мають розрядність 8, 10, 12 або 16 (відповідно кількість рівнів 28=256, 210=1024, 212=4096, 216=65536). В нашому прикладі мінімальна розрядність АЦП - 10. Отже фактична кількість рівнів квантування N(факт)=1024, таким чином точність квантування може бути приблизно в 2,5 рази вищою, ніж мінімально допустима.

Використання міри децібел при оцифровці

При виборі розрядності двійкового кодування оцифрованих величин (насамперед звуку) широко використвується міра децибел (дБ) - рис.2.6.

Рисунок 2.6 Визначення діапазону квантування в децібелах

Міра децибел взагалі має наступні особливості:
- така міра є безрозмірною. Вона показує в скільки разів вимірювана величина є більшою або меншою порівняно з базовим значенням;
- така міра використовується здебільшого для величин, які можуть змінюватись в широкому діапазоні (зокрема саме такою є гучність звуку). В звязку з цим тут використовуються логарифми;
- розділяють міру децибел для так званих «енергетичних» та «силових» величин. До перших належать зокрема потужність та енергія, до других амплітуда;
- кількість децибел для «силових» величин завжди вдвічі більше, ніж для «енергетичних», тому що потужність або енергія пропорційні квадрату амплітуди.

Формули для визначення величини в децибелах:
- для визначення кількості децибел «енергетичних» величин використовується формула 10lgPx/Po, де Px – рівень вимірюваної величини, а Po – базовий рівень. Зокрема, якщо Px потужніша за Po в 104 разів, маємо 10 lg104 = 10x4 = 40дБ за потужністю;
- для визначення кількості децибел «силових» величин використовується формула 20lgUx/Uo, де Ux – рівень вимірюваної величини, а Uo – базовий рівень. Зокрема, якщо Ux вища за Uo в 102разів, маємо 20 lg102 = 20x2 = 40 дБ за амплітудою;
- якщо вимірювана величина є меньшою за базову, то з наведених формул витікає, що міра в децибелах буде від'ємною.

Використання міри децибел в двійковому кодуванні і зокрема для звуку:
- оскільки значення кожного наступного розряду двійкового кода є вдвічі більшим, ніж попереднього (який можна вважати за базу), то ціна двійкового розряду в дБ буде для «енергетичних» величин 10 lg2=3 дБ/розряд, а для «силових» 20 lg2=6 дБ/розряд;
- у випадку звуку важлива його гучність, яка належить до «силових» величин. Отже при оцифровці звуку маємо ціну двійкового розряду 6 дБ/розряд;
- досить високим вважається рівень гучності звуку біля 100 дБ (при цьому за базу береться чутливість слуху людини). Такому рівню приблизно відповідає розрядність кодування 16 біт (16х6=96). Саме ця розрядність є найбільш поширеним стандартом.

Характеристики «шуму» квантування

При квантуванні зазвичай виникають похибки δu — відмінності вихідного безперервного значення величини u(i) відносно відповідного дискретного рівню u*(i) – рис.2.7. Такі похибки мають випадкові значення і зокрема звуться «шумом квантування». В практиці кількість рівнів квантування N є досить значною (десятки і більше). За таких умов розподіл щільності імовірності шуму квантування δu є близьким до рівномірного (рис.2.7).

Рисунок 2.7 Характеристики випадкових похибок («шуму») квантування

Зазвичай використовують один із двох підходів, який визначає характеристики шуму квантування: безперервне значення u(i) асоціюють із серединою інтервалу Δu, або з однією із його меж (наприклад нижньою). В першому випадку максимальне значення похибки квантування становить max(δu)=Δu/2 при середньому значенні m(δu)=0. В другому випадку max(δu)=Δu при m(δu)=Δu/2. При малих Δu різниця не є суттєвою. В практиці частіше використовується другий варіант більш простий в технічній реалізації. В обох випадках так зване стандартне відхилення (параметр розкиду) похибок δu визначається за формулою S(δu)=Δu/(2√3). Надалі ми використаємо ці формули в розгляді математичних моделей передачі інформації.

До цього моменту ми розглядали тільки варіант квантування з постійним кроком Δu. В деяких випадках здається доречним використання змінного рівню Δu. Наприклад, похибки в передачі звуку менше сприймаються на більш гучному фоні, отже можна було б зробити значення Δu пропорційним до амплітуди u(i) (подібні рішення колись дійсно практикувались). Але насправді простота технічної реализаціі АЦП із постійним кроком між рівнями має вирішальне значення. Саме такий спосіб застосовується нині повсюдно. Що ж до оптимізації сприйняття шуму кватнування, то вона реалізується програмно на подальших етапах обробки.

Правило Найквіста вибору частоти дискретизації.

Як ми уже знаємо, теорія твердить, що існує така мінімальна частота дискретизації, для якої вихідну безперервну залежність можна відтворити без викривлень.

Практичне правило вибору такої оптимальної частоти, що спирається на аналіз спектру сигналу для оцифрування, було запропоновано Гаррі Найквістом. Згідно цьому правилу частота дискретизації повинна бути вдівчі більшою, ніж максимальна частота вихідної безперервної залежності — (рис.2.8). Інакше кажучи, на кожний період максимальної частоти вихідного сигналу при дискретизації повинно приходитись як мінімум два відліки амплітуди. Для надійної практичної реалізації розрахункове значення fd зазвичай беруть із запасом в 10-15%.

Рисунок 2.8 Правило Найквіста для вибору частоти дискретизації

Класичним прикладом практичного використання правила Найквіста є дискретизація звуку. Зрозуміло, що для різних звукових повідомлень максимальна частота може суттєво різниться: порівняйте в уяві ревіння бика (fmax=30 Гц) та писк комара (fmax=10000 Гц). Однак спільною точкою “відліку” тут є обмеження слуху людини. Досить приблизно вважають, що людське вухо не сприймає частоти заввишки від fmax=20000 Гц = 20 кГц. Відсіль згідно правилу Найквіста та з урахуванням запасу в 10% маємо fd=2х20х1,1 = 44 кГц. Саме таку частоту дискретизації звуку найчастіше використовують в практиці.

Теорема Котельнікова про вибір частоти дискретизації

Математичне обгрунтування вибора частоти дискретизації було запропоновано радянським вченим Володимиром Котельниковим. Зокрема, згідно теоремі Котельникова будь-яка безперервна залежність u(t) може бути відновлена без втрат інформації по своїм дискретним відлікам u(i) з використанням формули, що наведена на рис.2.9.

Рисунок 2.9 Використання формули Котельнікова

Аналіз формули Котельникова (рис.2.9) показує, що вихідна залежність u(t) тут відновлюється підсумовуванням дискретних відліків, взятих з кроком дискретизації Δt, кожен з яких множиться на спеціальну коливальну функцію (функцію Котельнікова). В результаті може бути отримана згладжена залежність, що повністю збігається із вихідною.

Разом з тим, формула показує і обмеження такого підходу: підсумовування має вестися на безскінечній множині відліків, при цьому "хвости" коливальних функцій також поширюються в безкінечність. Буквально таке реалізувати звичайно неможливо. На практиці до цього додається складність технічної реалізації «ідеальних» функцій Котельникова.

Між тим в технічній реалізації згадані вище обмеження можуть бути компенсовані просто деяким збільшенням частоти дискретизації (на ті самі 10-20%, про які йшлося рані). Цо зокрема дозволяє суттєво спростити технічну реалізацію і саме так діють на практиці.


Спектральне подання оцифрованих повідомлень

Спектральне подання оцифрованого звука

Призначення спектрального подання звуку характерізує наступне:
- якщо часова форма звуку відображає зміну амплітуди звуку в часі, то спекральна характерізує розподіл амплітуд частотних складових - рис.2.10;
- часова форма є вихідною (саме вона присутня зокрема на виході мікрофону) і також використовується для відтворення звуку (зокрема за допомогою динаміків);
- спектральна форма використовується як допоміжна для аналіза та редагування частотного складу звуку, а також для підготовки до стискання коду.

Рисунок 2.10 Приклади часового та спектрального відображення звуку

Особливості цифрового спектрального подання звуку є зокрема такими:
- часова та спектральна форми пов'язані між собою і можуть конвертуватись одна в одну. Зокрема оцифрованій часовій діаграмі відповідає також цифрова спектральна діаграма;
- оскільки параметри звуку і зокрема його частотний склад можуть змінюватись в часі, зазвичай код звукового потоку розділяють на окремі блоки (фрейми);
- зазвичай фрейми включають біля 1000 відліків амплітуд. При стандартній частоті дискретизації 44 кГц тривалість звучання фрейму 1/44 c і він сприймається слухом як цілісність.

Практичне використання цифрового спектрального подання має зокрема наступні важливі напрямки:
- перевагою спектрального подання є компактність спектру для фреймів, де відсутні високочастотні складові. Це може використовуватись для ефективного стискання звуку;
- інша можливість — редагування спектру, яке дозволяє вибірково змінювати амплітуди частотних складових, відповідно змінюючи і звучання фреймів;
- окремий напрямок — використання сонограм, де спектри фреймів відображаються колонками пікселів, візуалізуючи зміни частотного складу в часі. При цьому амплітуда окремих частотних складових візуально відображається яскравістю відповідних пікселів, або їх кольорами (зокрема від червного для високих значень через зелений до синього при їх зменшенні і до чорного в їх відсутності).

Спектральні перетворення Фурьє для оцифрованого звука

Зміни подання звуку зазвичай виконуються з використанням математичного апарату спектральних перетворень Фурьє, зокрема в їх дискретній формі — рис.2.11.

Рисунок 2.11 Спектральні перетворення для оцифрованого звуку

Зокрема пряме дискретне перетворення Фурьє (пряме ДПФ) використовує як вихідні дані N відліків амплітуди звуку x[k] і завдяки їх обробці згідно формулі на рис.2.11 одержує N амплітуд частотного спектру X[n]. Зворотнє перетворення по значеннях X[n] відновлює часову послідовність x[k] по відповідній формулі на рис.2.11.

Звернемо увагу, що в формулах ДПФ на рис.2.11 використовуються саме комплексні змінні, тобто кожному елементу часової або спектральної діаграми повинно відповідати два числа. Однак, завдяки особливостям представлення всієї совокупності даних (частина цих коефіцієнтів можуть бути одержані із інших), використання ДПФ потребує саме N чисел, тобто не збільшує обсягу коду.

Разом з тим сама процедура ДПФ є досить трудомісткою. Отже для одержання лише одного компонента спектру із N потрібно обрахувати всі N компонентів відповідної часової послідовності, тобто, трудомісткість повного перетворення Q ~NxN. Наприклад для N=103 маємо 106 відповідних операцій, при цьому власно обчислення тригонометрічних функцій є досить трудомістким само по собі.

Такий недолік усуває використання модифікації ДПФ — так званого «швидкого перетворення Фурьє» (ШПФ). Тут лише завдяки раціональному перегрупуванню коефіцієнтів і відповідному перетворенню формул вдається без будь-яких втрат точності скоротити трудомісткість до рівню Q ~log2NxN/2. Зокрема у випадку N=103 будемо мати приблизно 5x103 операцій, тобто прискорення в 200 разів. Відповідно саме ШПФ широко застосовується в практиці спектральних перетворень звуку.

Спектральне подання растрових зображень

Рисунок 2.13 Спектральне подання для растрових зображень
Спектральне подання також широко використовуються для растрових зображень (найбільш популярним таким застосування є стандарт стискання JPEG) — рис.2.13.

Як і у випадку звуку спектральне подання будується для окремих блоків, на які ділиться зображення. Зокрема стандартом є розмір 8х8 пікселів, отже тут доречним є термін мікроблок. Щодо зображень використання спектральної форми не так очевидно, як у випадку звуку: тут частоти характеризують швидкості зміни яскравості пікселів всередині блоку.

Зокрема, якщо колір в блоці не змінюється, то частота вважається нульовою, а зміни в сусідніх пікселях відповідають максимальній частоті. В прикладі на рис.2.13 в нижньому мікроблоці зміна кольору є більш плавною, отже відповідний спектр вужчий. Як ми уже розуміємо, таке подання забезпечує кращі умови для стискання коду.

Зазвичай спектри будуються окремо для кожного із трьох базових складових кольорної моделі (наприклад, RGB). Типовим є також рішення із виділенням підсумкової яскравості пікселів Y, яка доповнюється двома кольорами. Такий підхід враховує підвищену чутливість зору саме до яскравості (в практиці нам це добре знайомо, бо звикли адекватно сприймати монохромні зображення).

Спектральні перетворення для растрових зображень

Математичний апарат для роботи із спектрами зображень є розвитком перетворень Фурьє, однак має істотні особливості — рис.2.14.

Рисунок 2.14 Спектральні перетворення оцифрованого зображення

Спектральні перетворення зображень на відміну від звуку повинні бути двомірними. Отже тут застосовується їх спеціальний тип, який має назву «дискретних косинус-перетворень» - ДКП. Зокрема пряме ДКП переводить матрицію P яскравостей пікселів в матрицю амплітуд спектру D, а зворотнє перетворення повертає вихідну форму. На рис.2.14 відображене саме пряме ДКП.

В просторовому поданні позиції коефіцієнтів pxy прямо відповідають розташуванню пікселів в блоці, а в спектральному коефіцієнт d11 (верхній лівий куток матриці) відповідає нульовій частоті, тобто фону, а коефіцієнт d88 (нижній правий куток матриці) - максимальній частоті, тобто найбільш дрібним деталям зображення. Для наочності коефіцієнти матриць також подаються у вигляді лінійної послідовності при цьому їх обіг виконується «змійкою» - рис. 2.14.

На відміну від ДПФ для звуку, перетоворення ДКП для зображень не є проблемним щодо трудомісткості. Згідно компактності стандартних мікроблоків всі процедури розрахунків оптимізовані і виконуються досить швидко. Це зокрема стало однією з передумов тривалої популярності стандарту JPEG, який використвується уже багато десятирічь.
О дисциплине ТИК
Почему «Теория информации и кодирования» - одна из самых интересных дисциплин, которые изучают будущие системщики и защитники информации?

В ней сочетаются золотая классика и самая актуальная современность computer-science.

продолжение
О сайте
Здесь вы найдете материалы, которые помогут в изучении дисциплины “Теория информации и кодирования” (ТИК) в том виде, как она преподается на кафедре ЭВМ ДИИТа.

На сайте размещены методические материалы:
  • электронный конспект лекций;
  • методическое обеспечение к лабораторным работам;
  • полезные ссылки.

продолжение
© 2008-2020 • Теория информации и кодирования
UP