Здавалка
Главная | Обратная связь

Применения цифровой обработки сигналов.



1. Передискретизация (ресамплинг)– это изменение частоты дискретизации цифрового сигнала. В комп. графике ресамплинг означает изменение размеров изображения. Существует множество различных алгоритмов увеличения изображения:1)метод ближайшего соседа (дублируется каждая строка и столбец) 2)билинейная интерполяция(получение промежуточных столбцов и строк линейной интерполяцией значений соседних столбцов и строк) 3)бикубическая и др. виды интерполяции(получение каждой точки нового изображения как взвешенной суммы большего числа точек исходного изображения).

Самый качественный ресамплинг получается при использовании алгоритмов, учитывающих необходимость работы не только с временной, но и с частотной областью. Алгоритм ресамплинга, основанный на идее максимального сохранения частотной информации изображения: Пусть нам нужно «растянуть» одномерный сигнал от длины n точек до m точек. 1) Интерполяция нулями, увеличивающая длину сигнала в m раз. Нужно умножить все отсчеты исходного сигнала на m, а потом после каждого отсчета сигнала нужно вставить m-1 нулевое значение.2) Выше старой половины частоты дискретизации возникают помехи (отраженные копии спектра), от которых необходимо избавиться с помощью НФ-фильтрации. 3)Так как частота дискретизации уменьшается в n раз, то из спектра сигнала удастся сохранить только его низкочастотную часть. Частоты выше половины будущей частоты дискретизации удаляются с помощью анти-алиасингового фильтра с частотой среза равной 1/n от текущей половины частоты дискретизации. 4) Прореживание полученного сигнала в n раз. Для этого достаточно выбрать из сигнала каждый n-й отсчет, а остальные – отбросить.

2. Анти-алиасинг изображений.Алиасинг в изображениях приводит к зубчатости краев фигур, муару, плохой читаемости текста и пр. Одним из основных способов его предотвращения является суперсамплинг. Этот прием заключается в генерации изображения с большим разрешением и ресамплингу этого изображения до нужного размера. Пример: если многократно увеличить картинку, а потом уменьшить его до нужного размера, результат будет лучше, чем если сразу уменьшить.Качество изобр. зависит от качества алгоритма ресамплинга и от степени суперсамплинга (во сколько раз увеличили картинку).

2. Псевдотонирование.Это создание иллюзии полноцветности изобр. с помощью небольшого числа цветов. Пример: фотографии в газетах, где любые оттенки серого передаются с помощью чередования мелких черных и белых точек. Изображение, равное разности исходного и псевдотонированного называется ошибкой квантования.

Способы псевдотонирования:1)Усечение (порог). Все пиксели с яркостью больше 0.5 получают яркость 1, все остальные – 0. 2)Упорядоченное псевдотонирование. Изображение разбивается на небольшие блоки одинакового размера. В каждом блоке находится средняя яркость изображения, в соответствии с которой выбирается количество белых пикселей в соответствующем блоке получаемого монохромного изображения. Обычно эти белые пиксели упорядочиваются в соответствии с некоторым регулярным шаблоном. 3)Сначала к изображению добавляется случайный шум (сигнал, не зависящий от изображения) необходимой амплитуды, а затем применяется порог. Такие алгоритмы называют диттерингом.4) Диффузия ошибки. Ошибка квантования, возникшая при квантовании данного пикселя, распространяется с обратным знаком на соседние пиксели и таким образом как бы компенсируется.

3. Выравнивание освещенности.Этот метод не реализуется линейной системой. Чтобы сбалансировать освещенность картинки, применяют гомоморфную обработку. Идея заключается в сведении нелинейной задачи к линейной. На реальной фотке получается произведение той картинки, которую мы хотим видеть и карты освещенности. Если бы в процессе фотографии эти сигналы складывались, то их можно было бы разделить с помощью обычного фильтра. Например, применив ВЧ-фильтр, мы бы «избавились от перепадов освещенности» (НЧ-сигнала), а оставили «само изображение». Чтобы это было возможно, систему приводят к линейной.

4. Улучшение изображений и художественные эффекты.Для этого применяются фильтры. Например, для придания изображению резкости можно воспользоваться фильтром, который усиливает сигнал на высоких частотах.

5. Поиск фрагментов в изображениях.Для этого можно применять двумерную корреляцию. Входным сигналом для поиска является изображение, а искомым сигналом – искомый фрагмент изображения.

6. Обработка трехмерных каркасов изображений.Специальные аналогии спектра и процесса фильтрации можно ввести для трехмерных сеток – каркасов трехмерных изображений. С помощью специальных операций «фильтрации» можно сглаживать эти пространственные сетки, детализировать их или наоборот устранять из них избыточность.

7. Компрессия изображений.Сжатие в частотной области. В JPEG фрагменты изобр. переводят в частотн. обл., а потом отбрасывают высокочастотные обл. с малыми амплитудами, а остальное кодируют.

 

 

Временная модель. Прогноз по предыдущему видеокадру. Изменения вследствие движения. Оценка и компенсация движения на основе блоков: прогноз макроблока с компенсированным движением, размер блока компенсации движения.

Видеокодер состоит из трех основных функциональных единиц: временной модели, пространственной модели и энтропийного кодера.

Временная модель.Целью временной модели является удаление избыточности между передаваемыми кадрами. Для этого создается кадр-прогноз, который вычитается из текущего кадра. Выходом этого процесса является остаточный кадр (разность кадров). Он кодируется и посылается декодеру, который воспроизводит кадр-прогноз по некоторым уже построенным кадрам, складывает его с остаточным кадром и, таким образом, восстанавливает текущий кадр. Кадр-прогноз формируется по одному или неск. прошлым или будущим «ссылочным» кадрам. Точность прогноза можно улучшить компенсированием движения между ссылочными кадрами и текущим кадром.

Прогноз по предыдущему видеокадру.Предыдущий кадр является кадр-прогнозом для текущего. Находится их разность. Разность содержит в себе остаточную энергию, то есть информацию, которая сжимается после временной модели. Лучший прогноз можно построить на основе компенсации движения между двумя этими кадрами.

Изменения вследствие движения.Можно проследить траекторию каждого пикселя между последовательными кадрами. Порождаемое поле траекторий пикселей называется оптическим потоком. Полное поле образуется векторами потока для всех пикселей. Точно зная поле потока, можно построить точный прогноз для большинства пикселей текущего кадра, перемещая каждый пиксель ссылочного кадра вдоль его вектора оптического потока. Точное вычисление оптического потока является довольно долгим, кроме того, придется пересылать все векторы оптического потока декодеру для декодирования и восстановления кадра-прогноза (в результате чего повышается объем пересылаемой информации, сводящий на нет преимущества маломощного остаточного кадра).

Оценка и компенсация движения на основе блоков. Это метод, который компенсирует перемещение прямоугольных областей или «блоков» текущего кадра. Блоки фиксированного размера МхN. Для каждого из них выполняется следующая процедура:

1) Оценка движения. Поиск на ссылочном кадре (ранее закодированном и переданном декодеру) «подходящего» блока из МxN пикселей путем сравнения с блоками области поиска. Популярным критерием схожести блоков служит энергия остатка, получаемого вычитанием блока-кандидата из фиксированного блока, т.е. выбирается блок, минимизирующий энергию остатка. 2) Компенсация движения. Выбранный кандидат становится прогнозом текущего блока и его вычитают из этого блока для получения остаточного блока. 3) Получение вектора движения. Остаточный блок кодируется и передается декодеру, который получает координаты вектора смещения текущего блока по отношению к позиции блока-кандидата.

Декодер использует вектор движения для нахождения блока-прогноза, декодирует остаточный блок и складывает его с прогнозом для реконструкции версии исходного блока.

Макроблок, соответствующий области из 16 х 16 пикселей на кадре, является базисной единицей для прогноза с компенсацией движения во многих важных визуальных кодовых стандартах, включая MPEG-1, MPEG-2, MPEG-4 Visual, H.263 и Н.264.

Область из 16 х 16 пикселей исходного кадра состоит из 256 сэмплов яркости (сгруппированные в 4 блока сэмплов 8 х 8), 64 голубых хроматических компонент и 64 красных хроматич. компонент (8 х 8) - всего 6 блоков.

Если имеется сильное расхождение между ссылочным и текущим кадром, можно кодировать макроблок без компенсации движения. Итак, кодер выбирает или моду intra(без компенсации движения), или моду inter (с компенсацией движения) для каждого макроблока.

Движущиеся объекты на видеосцене редко следуют строго вдоль границ блоков пикселей 16 х 16, поэтому более эффективным может быть использование переменных размеров блоков для оценки и компенсации движения. Чем меньше размер блока компенсации движения, тем лучше результат этой компенсации.

Уменьшение размера блока влечет за собой увеличение сложности (необходимо совершить больше операций поиска) и числа векторов движения, необходимых для декодирования. Компромисс в приспособлении размеров блоков к характеристикам изображений, т.е. можно выбирать большие размеры блоков для ровных однородных областей кадра, а для областей со многими деталями и со сложным движением следует уменьшать размер блоков.

 

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.