Аудиопроцессорная обработка сигналов звукового вещания
Учебное пособие для вузов
Покупка
Издательство:
Горячая линия-Телеком
Год издания: 2017
Кол-во страниц: 222
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-9912-0586-3
Артикул: 671062.02.99
Звуковой сигнал, передаваемый по каналам звукового вещания, был и будет востребован в общем ряду с большим количеством альтернативных источников информации. Рассмотрены основные характеристики сигналов и каналов звукового вещания, базовые процедуры, используемые при обработке звукового вещательного сигнала (ЗВС); основные алгоритмы обработки сигнала в канале передачи. Проведен анализ и оценка искажений сигнала на всех этапах его передачи - от первичного цифрового преобразования до аудиопроцессорной обработки. Особое внимание уделено авторами алгоритмам обработки и проблеме объективной оценки качества ЗВС в системах, не нормируемых в рамках современного метрологического обеспечения. Для студентов, обучающихся по направлениям подготовки бакалавров и магистров 11.03.02 и 11.04.02 - «Инфокоммуникационные технологии и системы связи», 11.03.01 и 11.04.01 -«Радиотехника», 10.05.02 - «Информационная безопасность телекоммуникационных систем», будет полезно специалистам эксплуатационных служб радиосвязи, радиовещания и телевидения.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 11.03.01: Радиотехника
- 11.03.02: Инфокоммуникационные технологии и системы связи
- ВО - Магистратура
- 11.04.01: Радиотехника
- 11.04.02: Инфокоммуникационные технологии и системы связи
- ВО - Специалитет
- 10.05.02: Информационная безопасность телекоммуникационных систем
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва Горячая линия – Телеком 2017 Рекомендовано УМО по образованию в области Инфокоммуникационных технологий и систем связи в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям подготовки 11.03.02 и 11.04.02 – «Инфокоммуникационные технологии и системы связи» квалификации (степени) «бакалавр» и «магистр»
УДК 681.84 ББК 32.884.1 Л64 Р е ц е н з е н т : зав. кафедрой телекоммуникационных систем МИРЭА, доктор техн. наук, профессор В. И. Нефедов; ген. директор ООО «Глобальные телерадиовещательные сети», доктор техн. наук А. Н. Иванчин Литвин С. А., Попов О.Б., Чернышева Т.В. Л64 Аудиопроцессорная обработка сигналов звукового вещания. Учебное пособие для вузов. – М.: Горячая линия – Телеком, 2017. – 222 с.: ил. ISBN 978-5-9912-0586-3. Звуковой сигнал, передаваемый по каналам звукового вещания, был и будет востребован в общем ряду с большим количеством альтернативных источников информации. Рассмотрены основные характеристики сигналов и каналов звукового вещания, базовые процедуры, используемые при обработке звукового вещательного сигнала (ЗВС); основные алгоритмы обработки сигнала в канале передачи. Проведен анализ и оценка искажений сигнала на всех этапах его передачи – от первичного цифрового преобразования до аудиопроцессорной обработки. Особое внимание уделено авторами алгоритмам обработки и проблеме объективной оценки качества ЗВС в системах, не нормируемых в рамках современного метрологического обеспечения. Для студентов, обучающихся по направлениям подготовки бакалавров и магистров 11.03.02 и 11.04.02 – «Инфокоммуникационные технологии и системы связи», 11.03.01 и 11.04.01 –«Радиотехника», 10.05.02 – «Информационная безопасность телекоммуникационных систем», будет полезно специалистам эксплуатационных служб радиосвязи, радиовещания и телевидения. ББК 32.884.1 Учебное издание Литвин Семен Анатольевич, Попов Олег Борисович Чернышева Татьяна Васильевна Аудиопроцессорная обработка сигналов звукового вещания Учебное пособие для вузов Тиражирование книги начато в 2017 г. Все права защищены. Любая часть этого издания не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения правообладателя © ООО «Научно-техническое издательство «Горячая линия – Телеком» www.techbook.ru © С. А. Литвин, О. Б. Попов, Т. В. Чернышева
Основные сокращения АП аудиопроцессор / абонентский приёмник АРГО автоматический регулятор уровня по гильбертовской огибающей АРУР автоматический регулятор уровня АЦП аналого-цифровой преобразователь АЧХ амплитудно-частотная характеристика БПФ быстрое преобразование Фурье (FFT) ВЧ высокочастотный ГО гильбертовская (аналитическая) огибающая ГОСТ Государственный стандарт ЗВ звуковое вещание ЗС/ЗВС звуковой сигнал / звуковой вещательный сигнал ИАОС интегральное абсолютное отклонение статистик ИКМ импульсно-кодовая модуляция (PCM) ИО интегральное отклонение ИУ индикатор уровня КЗВ канал звукового вещания МАС мгновенный амплитудный спектр (спектральный параметр сигнала) МКЗВ междугородный канал звукового вещания МККР Международный Консультативный Комитет по Радио (CCIR) МККТТ Международный Консультативный Комитет по телеграфии и телефонии (CCITT) МКСО метод комплексного статистического оценивания МСЭ Международный союз электросвязи (ITU) МСЭ-R Международный союз электросвязи, сектор радиосвязи МСЭ МСЭ-Т Международный союз электросвязи, сектор стандартизации МСЭ НЧ низкочастотный НЧПЗ нормированная частота появления значений ОВЧ очень высокие частоты (диапазон метровых волн) ОСКО относительное среднеквадратическое отклонение ОСМ относительная средняя мощность (энергетический параметр сигнала) ОСШ отношение сигнал/шум ОТ основной тон ОУП относительный уровень популярности ПАМ психоакустическая модель ПК персональный компьютер
ПО программное обеспечение ПТЭ правила технической эксплуатации ПФ пик-фактор РВ радиовещание; радиовещательный РВС радиовещательная станция РС речевой сигнал СВЧ сверхвысокая частота СЗВ сигнал звукового вещания СКО среднеквадратическое отклонение СП сигнал придыхания СПМ спектральная плотность мощности ССИ субъективно-статистические испытания ТВРП тракт вторичного распределения программ ТПмП тракт приёма программ ТПРП тракт первичного распределения программ ТФП трактов формирования программ ТЭРП тракт эфирного распространения программ ФОС фронт огибающей сигнала (параметр формы сигнала) ФЧХ фазо-частотная характеристика ЦАП цифро-аналоговый преобразователь ЦВК цифровой вещательный канал ЧПА частота появления атак ЭКЗВ электрический канал звукового вещания AAC Advanced Audio Coding — перспективное звуковое кодирование FFT Fast Fourier Transform — БПФ MOS Mean opinion score — средняя оценка мнений; средняя субъективная оценка MPEG Moving Picture Expert Group and associated audio — формат сжатия данных (дословно: группа экспертов по движущимся изображениям при ISO) MP-3 алгоритм MPEG-1 Layer 3 PAQM Perceptual audio quality measure — психоакустическое измерение качества звучания PCM Pulse Coded Modulation — импульсно-кодовая модуляция (ИКМ) PEAQ Perceptual Evaluation of Audio Quality — психоакустическое измерение качества широкополосных аудиокодеков RMS Root-Mean-Square — среднеквадратичный VCA Voltage-Controlled Amplifier — усилитель, управляемый напряжением
Введение Звуковое вещание (ЗВ) и телевидение (ТВ) стали неотъемлемой частью жизни общества, важным средством политического, эстетического и нравственного воздействия на население. Одним из главных преимуществ ЗВ является первичность слухового восприятия перед визуальным как средства доставки смысловой информации, а тем, кто утверждает, что 90% информации человек получает с помощью зрения, предлагаем посмотреть последние известия без звука. Просмотр ТВ передач предполагает прекращение всякой полезной деятельности, в отличие от ЗВ, при прослушивании программ которого возможно продолжение работы. В ряде случаев такое прослушивание просто необходимо, например, передачи для водителей знакомят их с дорожной обстановкой и помогают не заснуть. Специально подобранные музыкальные программы позволяют увеличить производительность труда на конвейере на 5–7%, увеличить удои коров на 20%, яйценоскость кур на 10–15%, урожайность зерновых на 30%. Комплексное воздействие гармонического ряда частот является катализатором для выработки ряда необходимых организму гормонов. Так называемая «плотная», физиологическая музыка (металл, рок и т.д.) действует угнетающе как на человека, так и на растения и животных, но способствует выработке организмом человека эндоморфинов (внутренних наркотиков). Все дальнейшее — как при приеме обычных наркотиков: привыкание, необходимость увеличения громкости и дозы. При прослушивании такой музыки 4–5 месяцев через головные телефоны происходит необратимое снижение слуха в области высоких частот, а через 3 месяца — снижение коэффициента умственного развития IQ на 20–30 пунктов (при среднем их количестве 130–140). Возможности РВ в деле формирования единомыслия были по достоинству оценены В.И. Лениным, писавшим, что вся страна должна слушать газету и декреты, читаемые в Москве. Рупор, непрерывно воспроизводящий звуковой сигнал, стал неотъемлемой частью пейзажа любой деревни, а так как большая часть современного населения городов — горожане первых поколений, то потребность в непрерывном прослушивании, при максимальной громкости, радиопрограмм у многих заложена генетически и, по-видимому, необходима для функционирования организма. Под вещанием подразумевается циркулярная передача необходимой обществу информации неограниченному количеству территориально рассредоточенных пользователей. Исторически термин «звуко
Введение вое вещание» часто подменяется бытовым термином «радиовещание», хотя доставка программ слушателю происходит по радио, интернет и проводным (кабельным) каналам. Радиовещание по-прежнему, несмотря на популярность телевидения, остается основным источником информации для миллионов людей, ежедневно включающих свои радиоприемники. В стране сосуществуют общероссийское, региональное и местное вещание с государственными, муниципальными и частными формами собственности. Однако объединяет всех российских радиовещателей то, что подавляющее большинство из них не являются владельцами радиопередающих средств с соответствующими вещательными частотами, а арендуют их. С появлением коммерческого радиовещания в крупных российских городах большую популярность приобрели частоты верхней части метрового диапазона волн, выделенные для вещания 88...108 МГц (или в обиходе ФМ). Во всех крупных городах нашей страны практически исчерпан имеющийся частотный ресурс для развития этого вида радиовещания. Идет острая конкурентная борьба за слушателя, успех которой во многом определяется подготовкой и аудиопроцессорной обработкой программ. Популярность различных информационно развлекательных радиостанций резко отличается и это при удручающей схожести звукового материала, используемого при формировании программ, 10% новостей и 90% музыкального наполнителя, причем, как показал анализ, это примерно 100 одних и тех же произведений, следующих в разном порядке. Следовательно, именно обработка сигнала в трактах формирования и передачи во многом определяет популярность радиостанции, стоимость рекламы и доходы сотрудников. Основные пути увеличения числа распределяемых программ радиовещания: – увеличение числа диапазонов для звукового вещания; – применение новых видов модуляции; – необходима демилитаризация частотного спектра (в этом направлении организациями, отвечающими в России за распределение и использование частотного спектра, ведется работа по снижению ограничений на использование частот для телевизионного и звукового радиовещания); – необходим переход к европейской системе Т-DAB многопрограммного цифрового радиовещания, для чего в РФ выделен диапазон 215 ... 240 МГц, и к цифровому радиовещанию DRM в диапазонах ниже 30 МГц.
Глава 1 Звуковой вещательный сигнал: описание и основные свойства 1.1. Распределения мгновенных значений Звуковым вещательным сигналом s(t) называют колебание, в основном соответствующее речи, музыке или их сочетанию. ЗВС считают случайным процессом, характеризующие который акустические или электрические величины непрерывно изменяются во времени (рис. 1.1). t U Рис. 1.1. Осциллограмма ЗС Как случайный процесс, звуковой вещательный сигнал характеризуется законом распределения его мгновенных значений, заданным плотностью вероятности W(x) или функцией распределения F(x). Для получения распределений анализ проводят на достаточно продолжительных отрывках. Минимальное время наблюдения T0, дальнейшее увеличение которого не приводит к изменению распределения, называется интервалом стационарности. Для речи T0 = 2...3 мин, а для музыки — от 5 мин до нескольких часов — в зависимости от характера произведения. На рис. 1.2 приведены типичные экспериментальные результаты, полученные для речевого (а) и музыкальных (б) ЗВС [1]. Здесь по оси ординат отложено произведение W(x)×σ, где σ — среднеквадратическое отклонение (СКО); по оси абсцисс — отношение его мгновенных значений x к σ. Характер кривых на рис. 1.2,б указывает на зависимость распределений от типа звучаний: область 1 — вокал, эстрадная и симфоническая музыка, кривая 2 — хор с оркестром, джазовая музыка. 1.2. Уровень ЗВС Уровень ЗВС характеризует сигнал в определенный текущий момент времени и представляет собой выраженное в децибелах выпрямленное и усредненное за некоторый предшествующий промежуток
Глава 1 а) б) Рис. 1.2. Распределение плотности вероятности мгновенных значений речевого (а) и музыкального (б) ЗВС Рис. 1.3. Пример уровнеграммы ЗВС времени τ напряжение вещательного сигнала, отнесенное к некоторой условной величине U0: N(t, τ) = 20 lg u(t, τ) U0 . (1.1) Здесь U0 — среднеквадратическое значение сигнала, принятое за начало отсчета уровней; ему приписывается уровень 0 дБ. Международными рекомендациями установлены нулевые уровни: – электрические: для напряжения — 0,775 В (напряжение на нагрузке 600 Ом, на которой выделяется мощность 1 мВт); для мощности — 1 мВт; – акустические: для звукового давления — 2 · 10−5 Па (это минимальное звуковое давление, соответствующее порогу слышимости в области максимальной чувствительности уха 1...4 кГц); для интенсивности звука — 10−12 Вт/м2. График функции N(t, τ) называется уровнеграммой сигнала s(t). Вид уровнеграммы (рис. 1.3) зависит от условий ее измерения, от временных характеристик анализатора. Форма уровнеграммы зависит и от вида детектирования.
Звуковой вещательный сигнал: описание и основные свойства 9 Закон распределения уровней выражается плотностью W(N) или функцией вероятности F(N). Он весьма стабилен (особенно для больших τ) и почти не зависит от характера звуковой программы на длительностях не менее интервала стационарности. Уровнеграммы для оценки состояния звукового тракта при передаче по нему ЗВС измеряют при τ = 10...20 мс, а для оценки громкости τ выбирают около 200 мс. На рис. 1.4,а приведены три функции распределения уровней музыкальных программ (за 0 дБ принята медиана распределений), а на рис. 1.4,б — для речевого сигнала [2, 3]. а) б) Рис. 1.4. Функции распределения уровней музыкальных программ (а) и речевого сигнала (б) Пределы изменения уровня определяют динамический диапазон (Dc) уровней сигнала. При теоретическом определении динамического диапазона уровней сигнала вводят понятия квазимаксимального и квазиминимального уровня: вероятность превышения квазимаксимального значения достаточно мала (0,01...0,02), а квазиминимального — достаточно велика и составляет 0,98...0,99. Динамический диапазон уровней определяется разностью квазимаксимального и квазиминимального уровней. Разность между квазимаксимальным и усредненным за длительный промежуток времени уровнями называют пикфактором: Πф = Nкв.макс −Nср. Для музыкальных сигналов он может достигать 20...28 дБ, а для речи — в среднем 12 дБ. Для ЗВС результаты измерений уровней будут устойчивы, ес Таблица 1.1. Динамический диапазон уровней звуковых сигналов (в дБ) Речь диктора 25...35 Разговорная речь 35...40 Эстрадная музыка 35...40 Актерская речь (худ. чтение) 35...45 Малые ансамбли, хор 45...55 Симфоническая музыка 65...75
Глава 1 ли время наблюдения достаточно велико и средняя мощность сигнала постоянна. Минимальное время усреднения, при котором средняя мощность не зависит от момента начала измерения, приблизительно равно интервалу стационарности сигнала T0. 1.3. Частотный диапазон В табл. 1.2 приведены сведения о частотных диапазонах некоторых источников [3]. Таблица 1.2. Частотные диапазоны некоторых источников звука Источник звука Граничные частоты нижняя, Гц верхняя, кГц Мужской голос 100 7 Женский голос 200 9 Рояль 30 5 Скрипка 200 3 Шум шагов 100 10 Аплодисменты 150 15 На практике спектральные характеристики ЗВС чаще всего используются в виде его энергетического спектра, а именно — усредненной на интервале времени τ спектральной плотности мощности S2 (среднего квадрата напряжения фильтрованного сигнала), отнесенной к полосе пропускания фильтра ∆f, Гц (B2/Гц) G(f0, t, τ) = 2 ∆fτ f0+∆f/2 f0−∆f/2 |S(f, t, τ)|2df. (1.2) Это не что иное, как средний (по полосе пропускания фильтра) квадрат модуля мгновенного амплитудного спектра во временном окне τ, то есть результат двух усреднений: по частоте спектральным окном ∆f и по времени временным окном τ. У однородной звуковой программы при τ ⩾T0 величина G не зависит от времени. Спек Рис. 1.5. Спектральная плотность мощности русской речи