18-08-2023
Передискретиза́ция (англ. resampling) в обработке сигналов — изменение частоты дискретизации дискретного (чаще всего цифрового) сигнала. Алгоритмы передискретизации широко применяются при обработке звуковых сигналов, радиосигналов и изображений (передискретизация растрового изображения — это изменение его разрешения в пикселах).
Отсчёты сигнала, соответствующие новой частоте дискретизации, вычисляются по уже имеющимся отсчётам и не содержат новой информации.
Повышение частоты дискретизации называется интерполяцией, понижение — децимацией.[1]
Содержание |
Согласно теореме Котельникова любой непрерывный сигнал с финитным спектром (то есть таким спектром, в котором спектральные составляющие, соответствующие частотам выше или равным некоторой частоты , отсутствуют) может быть представлен в виде отсчётов дискретного сигнала с частотой дискретизации . При этом такое преобразование является взаимно однозначным, то есть при соблюдении условий теоремы Котельникова по дискретному сигналу можно восстановить исходный сигнал с финитным спектром без искажений.[2]
При передискретизации отсчёты сигнала, соответствующие одной частоте дискретизации, вычисляются по имеющимся отсчётам этого же сигнала, соответствующим другой частоте дискретизации (при этом предполагается, что обе частоты дискретизации соответствуют условиям теоремы Котельникова). Идеальная передискретизация эквивалентна восстановлению непрерывного сигнала по его отсчётам с последующей дискретизацией его на новой частоте.[3]
Точное вычисление значения исходного непрерывного сигнала в определённой точке производится следующим образом:[4][5]
где — i-й отсчёт сигнала, — момент времени, соответствующий этому отсчёту, — циклическая частота дискретизации, — интерполированное значение сигнала в момент времени .
Функция не является финитной, поэтому для вычисления значения сигнала в определённый момент времени с помощью вышеприведённого выражения необходимо обработать бесконечное число его отсчётов (как в прошлом, так и в будущем), что нереализуемо на практике. В реальной жизни интерполяция осуществляется с помощью других фильтров, при этом выражение для неё принимает следующий вид:[6][7]
где — импульсная характеристика соответствующего восстанавливающего фильтра. Вид этого фильтра выбирается в зависимости от задачи.[8]
Прямое вычисление новых отсчётов сигнала по вышеприведённым формулам требует значительных вычислительных ресурсов и нежелательно для приложений реального времени. Существуют важные частные случаи передискретизации, для которых вычисление новых отсчётов производится проще:[9]
При таких ограничениях становится удобным применение стандартных реализаций цифровых фильтров для передискретизации.
Выбор функции обуславливается компромиссом между качеством передискретизации (то есть близости её к идеальной) и вычислительной сложностью этого процесса. В принципе, для передискретизации может быть использован любой фильтр нижних частот с необходимой частотой среза. КИХ-фильтры применяются для этих задач чаще, чем БИХ-фильтры, из-за возможности построения КИХ-фильтров с линейной фазо-частотной характеристикой.[10]
Чаще всего при передискретизации используются следующие классы цифровых фильтров:[11]
1. Фильтры, построенные, исходя из критерия близости частотной характеристики к частотной характеристике идеального фильтра нижних частот:
2. Классические способы интерполяции функций (часто применяются для изображений)[12]:
3. CIC-фильтры (каскады гребёнчатых фильтров и интеграторов).[13] Этот класс фильтров не использует умножений при вычислении, что позволяет сэкономить вычислительные ресурсы.
Процесс уменьшения частоты дискретизации сигнала называется децимацией.[1] Иногда этот термин употребляют только для уменьшения частоты дискретизации в целое число раз (далее ).[14] Децимация цифрового сигнала с целым коэффициентом производится в два этапа:[10][15]
В англоязычной литературе второй из этих этапов иногда обозначают термином downsampling.[16] В обиходе этот термин может употребляться как синоним термина «децимация».
Первый этап необходим для исключения наложения спектров, природа которого аналогична наложению спектров при первоначальной дискретизации аналогового сигнала.[15] Наложение спектров особенно заметно на тех участках сигнала, которые содержат значительные высокочастотные спектральные составляющие. Так, на приведённых в начале статьи фотографиях небо практически не подвергнулось наложению спектров, но эффект становится заметным, если обратить внимание на резкие переходы.
При программной реализации алгоритма децимации «лишние» отсчёты не удаляются, а просто не вычисляются. При этом число обращений к цифровому фильтру уменьшается в раз. При аппаратной реализации экономии можно достичь путём использования полифазных фильтров.[17]
Интерполяцией называют увеличение частоты в целое или дробное число раз[1] путем вычисления промежуточных отсчетов по уже имеющимся. Идеальная интерполяция позволяет точно восстановить значения сигнала в промежуточных отсчётах.
Стандартный алгоритм интерполяции сигнала с целым коэффициентом заключается в следующем:[18]
В англоязычной литературе первый из этих этапов иногда обозначается термином upsampling.[16] При этом в обиходе этот термин может употребляться как синоним термина «интерполяция».
При программной реализации интерполяции нулевые отсчёты не участвуют в вычислении выходного сигнала фильтра, что позволяет оптимизировать процесс вычисления. При аппаратной реализации для экономии ресурсов возможно использование полифазных фильтров.[19][20]
Для того, чтобы изменить частоту дискретизации сигнала в раз ( и — целые положительные числа), можно сначала увеличить частоту дискретизации в раз, а затем уменьшить её в раз. Фильтрацию сигнала достаточно произвести всего один раз — между интерполяцией и децимацией.[21]
Недостатком данного метода является необходимость фильтрации сигнала на повышенной в раз частоте дискретизации, что требует значительных вычислительных ресурсов. При этом соответствующая частота может во много раз превосходить как исходную, так и окончательную частоту передискретизации, особенно если и — близкие большие числа.[22] Так, например, при передискретизации звукового сигнала с 44100 Гц до 48000 Гц этим методом необходимо увеличить частоту дискретизации в 160 раз до 7056000 Гц и затем уменьшить её в 147 раз до 48000 Гц. Таким образом, в данном примере вычисления приходится производить на частоте дискретизации более 7 МГц.
Метод передискретизации с помощью полифазных фильтров аналогичен предыдущему, с тем отличием, что в нём вместо одного фильтра, работающего на высокой частоте дискретизации, используется несколько фильтров, работающих на низкой частоте. При этом удаётся добиться сокращения количества необходимых вычислений, так как для каждого отсчёта необходимо вычислить выходной сигнал только одного из этих фильтров.[20][23]
Полифазный фильтр представляет собой набор небольших фильтров, работающих параллельно, каждый из которых обрабатывает только подмножество отсчётов сигнала (если всего имеется фильтров, каждый фильтр будет обрабатывать только каждый -й отсчёт).
Полифазные фильтры применяются для передискретизации как с целым, так и с дробным коэффициентом.[24]
Передискретизация с помощью ДПФ используется для повышения частоты дискретизации в целое или дробное число раз. Алгоритм работает только с конечными отрезками сигнала. Пусть — начальное число отсчётов, — число отсчётов в передискретизованном сигнале. Алгоритм включает в себя следующие операции:[25][26]
1. Вычисляется ДПФ исходного сигнала (чаще всего по алгоритму быстрого преобразования Фурье).
2. В середину спектра вставляется необходимое число нулевых компонент:
3. Вычисляется обратное дискретное преобразование Фурье с нормировкой.
Любой метод, основанный на ДПФ, предназначен в первую очередь для периодических дискретных сигналов. Для обработки непериодических сигналов необходимо выбирать отрезки сигнала для вычисления ДПФ таким образом, чтобы их концы перекрывались.[27]
Широко применяется как аппаратная (на основе специализированных микросхем[28][29] или FPGA[30]), так и программная (на базе процессоров общего назначения (см. ниже) или сигнальных процессоров[31]) реализация алгоритмов передискретизации.
Выбор конкретной реализации алгоритма передискретизации является результатом компромисса между качеством преобразования и его вычислительной сложностью. Основным параметром, влияющим на эти характеристики, является близость используемых цифровых фильтров к идеальным. Более качественные фильтры требуют больших ресурсов для вычисления.[32]
На практике передискретизация в большинстве случаев ведёт к потере информации о сигнале по следующим причинам:
Таким образом, при увеличении частоты дискретизации с последующим уменьшением её до исходного значения качество сигнала будет потеряно (если только высокая частота не кратна низкой).
Дискретизация сигналов с запасом по частоте дискретизации (англ. oversampling) подразумевает дискретизацию сигнала на частоте, в несколько раз превышающей частоту Котельникова с последующей децимацией. Такой подход позволяет добиться следующих преимуществ[35]:
Аналогичный подход применяется и при восстановлении сигнала по его отсчётам для упрощения аналогового фильтра восстановления.[36]
Оборудование, предназначенное для воспроизведения цифрового звука, как правило, рассчитано на вполне определённую частоту дискретизации сигнала непосредственно перед цифро-аналоговым преобразованием. Все звуковые сигналы с другими частотами дискретизации должны быть рано или поздно передискретизованы.[37]
Передискретизация звукового сигнала на требуемую частоту может осуществляться медиаплеером, драйвером звуковой карты или самой звуковой картой. Использование программы-проигрывателя для данной цели может быть оправдано, если есть желание избежать аппаратной передискретизации звука (или передискретизации драйвером) с целью добиться более высокого качества (при большей загрузке центрального процессора). Однако программная передискретизация воспроизводимого материала на частоту, отличную от частоты, поддерживаемой оборудованием, не имеет смысла и приводит только к потере качества сигнала.
Существуют программные передискретизаторы звуковых сигналов с открытым исходным кодом:
Также передискретизация поддерживается программами-редакторами звука (такими как Adobe Audition, Sony Sound Forge или Audacity).
Изменение разрешения является одной из распространённых операций обработки изображений. Передискретизация, приближенная к идеальной, не всегда является желательной. Наоборот, результаты работы фильтров с частотной характеристикой, далёкой от идеальной, могут визуально восприниматься как хорошие.[40] Выбор фильтра для передискретизации является результатом компромисса между типом и выраженностью артефактов и вычислительной сложностью преобразования (актуальной для приложений реального времени).
Типичные артефакты при изменении разрешения изображения:[12]:
Для передискретизации изображений применяется большое число фильтров, которые можно классифицировать следующим образом[12]:
Нижеприведённые изображения иллюстрируют применение наиболее часто используемых фильтров изменения размера изображений. При увеличении размера изображения без фильтра изображение получается чётким, но пикселизованным. При билинейной интерполяции пикселизация меньше заметна, но изображение размыто. При использовании фильтра Гаусса изображение размыто, но пикселизации практически не заметно. При использовании фильтра Ланцоша пикселизация отсутствует, изображение также размыто и заметен звон (видимый как светлая каёмка вокруг фигур).
Изображение, увеличенное в 4 раза без фильтра
Изображение, увеличенное в 4 раза с билинейной интерполяцией
Изображение, увеличенное в 4 раза с фильтром Гаусса
Изображение, увеличенное в 4 раза фильтром Ланцоша
При демодуляции цифровых сигналов желательно, чтобы частота дискретизации сигнала была кратна его скорости манипуляции (иначе говоря, чтобы на каждый символ приходилось одинаковое число отсчётов сигнала). Однако частота дискретизации входного сигнала с АЦП, как правило, фиксирована, а скорость манипуляции может меняться. Решением является передискретизация сигнала.[41]