Просторова дискретизація. Обробка графіки

Просторова дискретизація. Обробка графіки

У ті часи, коли ще комп 'ютери мали не настільки потужні можливості, як зараз, ні про яке перетворення зображень на папері або на плівці не могло бути й мови. Зараз же прийнято вважати, що таким об 'єктам відповідає аналогова форма. З появою нових технологій стало можливим виробляти оцифровку (наприклад, за допомогою сканерів). Завдяки цьому з 'явилася так звана дискретна форма зображень. Але яким же чином проводиться переклад графіки з однієї форми в іншу? Коротко про суть таких методів далі і буде розказано максимально докладно і просто, щоб кожен користувач зрозумів, про що йдеться.

Що таке просторова дискретизація в інформатиці?

Для початку розгляньмо загальне поняття, пояснивши його найпростішою мовою. З однієї форми на іншу графіку перетворюється просторовою дискретизацією. Щоб зрозуміти, що це таке, розгляньмо простий приклад.

Якщо взяти якусь картину, написану акварельними фарбами, неважко помітити, що всі переходи є плавними (безперервними). А ось на відсканованому зображенні, яке було надруковано на струменевому принтері, таких переходів немає, оскільки воно складається з безлічі дрібних точок, званих пікселями. Виходить, що піксель - це своєрідна будівельна цеглинка, яка має певні властивості (наприклад, має свій колір або відтінок). З таких цеглинок і складається повне зображення.

У чому полягає суть методу просторової дискретизації?

Якщо говорити про суть самого методу перетворення графіки за допомогою таких технологій, можна навести ще один приклад, який допоможе зрозуміти, як це все працює.

Відцифровані зображення, що при скануванні, що при виведенні на екран комп 'ютерного монітора, що при друку, можна порівняти ще й якоюсь подобою мозаїки. Тільки тут в якості одного шматочка мозаїки виступає піксель. Це є одна з основних характеристик всіх сучасних пристроїв. Як вже можна було здогадатися, чим більше таких точок, і чим менше розмір кожної з них, тим більш плавними будуть переходи. Зрештою саме їх кількість для кожного конкретного пристрою визначає його дозволну здатність. В інформатиці для такої характеристики прийнято розраховувати кількість пікселів (точок) на дюйм (dpi - dot per inch), причому і вертикальному, і в горизонтальному напрямку.

Таким чином, створюється четверта просторова сітка, що чимось нагадує звичайну систему координат. Для кожної точки в такій системі можна задавати власні параметри, які відрізнятимуться від сусідніх точок.

Фактори, що впливають на якість кодування

Але не тільки вищеописані приклади повною мірою відображають те, як працює просторова дискретизація. Кодування графіки враховує ще кілька важливих параметрів, від яких залежить якість оцифрованого зображення. Вони застосовуються не тільки до зображень, але й до пристроїв, що відтворюють графіку.

В першу чергу, сюди відносять такі характеристики:

  • частота дискретизації;
  • дозволяюча здатність;
  • глибина кольору.

Частота дискретизації

Під частотою дискретизації розуміється розмір фрагментів, з яких складається зображення. Цей параметр рівною мірою можна побачити в характеристиках оцифрованих зображень, сканерів, принтерів, моніторів та графічних карт.

Правда, тут є одна заковика. Справа в тому, що при підвищенні загальної кількості точок можна отримати більш високу частоту. Але ж при цьому відповідно в більшу сторону змінюється і розмір файлу зберігається вихідного об 'єкта. Щоб уникнути цього, в даний час застосовується штучне підтримання розміру на одному постійному рівні.

Поняття роздільної здатності

Про цей параметр вже було згадано. Однак якщо подивитися на пристрої виведення зображень, тут картина дещо інша.

Як приклад параметрів, які використовує просторова дискретизація, розглянемо сканери. Так, наприклад, у характеристиках пристрою вказано роздільну здатність 1200 х 1400 точок на дюйм. Сканування здійснюється шляхом переміщення смуги світлочутливих елементів уздовж сканованого зображення. Але ось перше число означає оптичну роздільну здатність самого пристрою (кількість скануючих елементів в одному дюймі смуги), а друге відноситься до апаратної роздільної здатності і визначає кількість "мікропереміщень" смуги зі скануючими елементами по зображенню при проходженні одного дюйма картинки.

Глибина кольору

Перед нами ще один важливий параметр, без урахування якого зрозуміти повною мірою, що таке просторова дискретизація. Глибина кольору (або глибина кодування) зазвичай виражається в бітах (так само, до речі, можна віднести і до глибини звуку) і визначає кількість кольорів, які були задіяні при побудові зображення, але в кінцевому підсумку відноситься до палітр (наборів кольорів).

Наприклад, якщо переглянути чорно-білу палітру, що містить лише два кольори (без врахування градацій відтінків сірого), кількість даних при кодуванні кожної точки можна обчислити за наведеною формулою, враховуючи, що N - загальна кількість кольорів (у нашому випадку N = 2), а I - кількість станів, які може приймати кожна точка (у нашому випадку I = 1, оскільки варіантів може лише два: або чорний, або білий колір). Таким чином, NI = 21 = 1 біт.

Квантування

Просторова дискретизація також може враховувати і параметр, який називається квантуванням. Що це таке? У чомусь це нагадує методику інтерполювання.

Суть процесу полягає в тому, що величина відліку сигналу замінюється найближчим сусіднім значенням з фіксованого набору, який являє собою список рівнів квантування.

Щоб краще розібратися, як перетворюється графічна інформація, подивіться на зображення вище. На ньому представлена графіка у вихідній (аналоговій формі), зображення із застосування квантування і побічні спотворення, звані шумами. На другому фото зверху можна побачити своєрідні переходи. Вони носять назву шкали квантування. Якщо всі переходи однакові, шкала називається рівномірною.

Цифрове кодування

Під час перетворення графічної інформації слід врахувати, що, на відміну від аналогового сигналу, квантовий сигнал може приймати тільки абсолютно певну фіксовану кількість значень. Це дозволяє перетворити їх на набір символів і знаків, послідовність яких називають кодом. Фінальна послідовність називається кодовим словом.

Кожне кодове слово відповідає одному інтервалу квантування, а для кодування використовується двійковий код. При цьому іноді слід ще враховувати і швидкість передачі даних, яка являє собою витвір частоти дискретизації на довжину кодового слова і виражається в битах в секунду (bps). Грубо кажучи, це не що інше, як максимально можлива кількість переданих двійкових символів в одиницю часу.

Приклад відеопам 'яті для відображення на моніторі растрового зображення

Нарешті, ще один важливий аспект, пов 'язаний з тим, що являє собою просторова дискретизація. Растрові зображення на екрані монітора відтворюються за певними правилами і потребують затрат пам 'яті.

Наприклад, на моніторі встановлено графічний режим з роздільною здатністю 800 х 600 точок на дюйм і глибиною кольору 24 біт. Загальна кількість точок дорівнюватиме 800 х 600 х 24 біт = 11 520 000 біт, що відповідає або 1 440 000 байт, або 1406,25 Кб, або 1,37 Мб.

Способи стиснення відеоінформації

Технологія просторової дискретизації, як вже зрозуміло, застосовна не тільки до графіки, але і до відеозображень, які в деякому сенсі теж можна віднести до графічної (візуальної) інформації. Правда, оцифровка такого матеріалу до деяких пір проводилася з обмеженими можливостями, оскільки кінцеві файли виявлялися такими величезними, що тримати їх на комп 'ютерному жорсткому диску було недоцільно (згадайте хоча б вихідний формат AVI, свого часу розроблений фахівцями компанії Microsoft).

З появою алгоритмів M-JPEG, MPEG-4 і H.64 стало можливо зменшувати кінцеві файли з коефіцієнтом зменшення розміру в 10-400 разів. Багато хто може заперечити з приводу того, що стиснута відеозображення матиме нижчу якість порівняно з оригіналом. У певному сенсі так воно і є. Однак у таких технологіях зменшення розміру можна виробляти і з втратою якості, і без втрат.

Розрізняють два основних методи, за якими проводиться стиснення: внутрішньокадрове і міжкадрове. Обидва таких варіанти базуються на виключенні з зображення повторюваних елементів, однак не зачіпають, наприклад, зміни яскравості, кольору тощо. Що в першому, що в другому випадку, різниця між сценами в одному кадрі або між двома сусідніми є незначною, тому різниця на око особливо не помітна. Натомість, коли ви видаляєте з файлу вищевказані елементи, різниця між вихідним та кінцевим зображенням досить істотна.

Одним з найцікавіших, хоча і досить складних методів, які використовує просторова дискретизація для стиснення зображень, є технологія, що отримала назву дискретного косинусного перетворення, запропонована В. Ченом в 1981 році. Заснована вона на матриці, в якій, на відміну від вихідної, описує тільки величини відліків, представлені значення швидкості їх зміни.

Таким чином, її можна розглядати, як якусь сітку зміни швидкостей у вертикальному і горизонтальному напрямках. Розмір кожного блоку визначається технологією JPEG і має розмір 8 х 8 пікселів. А ось стиснення застосовується до кожного окремо взятого блоку, а не до цілого зображення. Таким чином, різниця між вихідним і кінцевим матеріалом стає ще менш помітною. Іноді в комп 'ютерній термінології таку методику називають ще субдискретизацією.

Далі для яскравості і кольору може застосовуватися описане вище квантування, при якому кожна величина косинусного перетворення ділиться на коефіцієнт квантування, який можна знайти в спеціальних таблицях, отриманих на основі так званих психофізичних тестів.

Самі ж таблиці відповідають строго визначеним класам блоків, згрупованих за активністю (рівномірне зображення, неструктуроване зображення, горизонтальний або вертикальний перепад тощо). Іншими словами, для кожного блоку встановлюються свої власні значення, які непримінні до сусідніх або тим, що відрізняються класом.

Нарешті, після квантування на основі коду Хаффмана проводиться видалення надлишкових коефіцієнтів (скорочення надлишковості), що дозволяє отримати для подальшого кодування кодове слово з довжиною менше одного біта для кожного коефіцієнта (VLC). Далі формується лінійна послідовність, для якої застосовується метод зигзагоподібного зчитування, що групує значення в кінцевій матриці у вигляді значущих величин і послідовностей нулів. А ось якраз їх і можна прибрати. Інші комбінації стискаються стандартним способом.

А взагалі, фахівці особливо не рекомендують робити кодування графічної інформації з використанням технологій JPEG, оскільки вони мають ряд недоліків. По-перше, багаторазове пересбереження файлів незмінно призводить до погіршення якості. По-друге, через те, що об 'єкти, закодовані за допомогою JPEG, не можуть містити прозорих областей, застосовувати такі методи до графічних зображень або сканованих зразків художньої графіки можна тільки в тому випадку, якщо вони по вертикалі і горизонталі не перевищують розмір 200 пікселів. В іншому випадку погіршення якості кінцевого зображення буде виражено дуже яскраво.

Правда, алгоритми JPEG стали основою для технологій стиснення MPEG, а також для безлічі стандартів конференц-зв 'язку на кшталт H.26X і H32X.

Замість післямови

Ось коротко і все, що стосується розуміння питань, пов 'язаних перетворенням аналогової форми графіки і відео в дискретну (за аналогією такі методики використовуються і для звуку). Описані технології досить складні для розуміння пересічним користувачем, проте деякі важливі складові основних методик зрозуміти все-таки можна. Тут не розглядалися питання налаштування моніторів для отримання максимально якісної картинки. Однак з питання, що нас цікавить, можна зазначити, що встановлювати максимально можливу роздільну здатність варто не завжди, оскільки завищені параметри можуть призвести до непрацездатності пристрою. Те ж саме стосується і частоти оновлення екрану. Краще використовувати рекомендовані виробником значення або ті, які операційна система після встановлення відповідних драйверів і керуючого програмного забезпечення пропонує використовувати за замовчуванням.

Що ж стосується самостійного сканування або перекодування інформації з одного формату в інший, слід використовувати спеціальні програми і конвертери, однак для того, щоб уникнути зниження якості, максимально можливим стисненням з метою зменшення розмірів кінцевих файлів, краще не захоплюватися. Такі методи застосовуються тільки для тих випадків, коли інформацію потрібно зберегти на носіях з обмеженим обсягом (наприклад, CD/DVD-диски). Але в разі наявності достатнього місця на вінчестері, або коли потрібно створити презентацію для трансляції на великому екрані, або роздрукувати фотографії на сучасному обладнанні (фотопринтери не в рахунок), якістю краще не нехтувати.