Новые методы регулирования громкости в телевизионном вещании

Никто не будет спорить, что основная информация в телевидении передается через изображение. Но общее впечатление о телевизионной передаче формируется не только на основе оценки качества самой картинки – наряду с ним огромную роль играет качество сопровождающего звука. Самое высококачественное изображение будет обесценено, если оно сопровождается плохим звуком: резким или глухим, искаженным или неразборчивым.

В ходе проведения субъективных экспертиз телепередач выяснилось: даже качество собственно картинки, если она сопровождается плохим звуком, оценивается экспертами ниже, чем той же картинки, но в сопровождении звука высокого качества. К сожалению, телезрители часто жалуют- ся на то, что техническое качество звукового сопровождения отечественных телепередач далеко не всегда безупречно. Одной из главных проблем и общей бедой телевизионного вещания являются неожиданные резкие скачки громкости звука в телепередачах.

Очень часто телезрители обращают внимание на неоправданные завышения или занижения громкости, не вытекающие из содержания передачи. Режущие слух перепады громкости замечаются не только при переключении с одной программы на другую, но даже внутри одной и той же передачи. Особенно болезненно воспринимается большая разница громкости при переходе от фильмов к рекламе и обратно. Происходит это потому, что в процессе производства рекламных роликов звук в них подвергается сильной компрессии динамического диапазона. Делается это специально, чтобы сделать рекламу погромче и тем привлечь к ней внимание телезрителя. При этом телевизионная реклама, неожиданно врываясь в программу, звучит по сравнению с ней громче децибел на 15, а то и на все 18! И это очень раздражает слушателя, вынужденного то убавлять, то прибавлять громкость. Прыжки громкости в передачах замечались и в прошлые годы, когда рекламы в вещании практически не было. Несбалансированность звука часто проявлялась и на радио. Наиболее заметно это было в передачах, в которых перемежались речевые и музыкальные фрагменты. Преобладание громкости музыкальных фрагментов над речевыми было иногда столь сильным, что слушатель был вынужден много раз в течение одной передачи подстраивать громкость своего приемника. Причины этого явления хорошо известны специалистам. Традиционно, еще когда вещание было только аналоговым, выравнивание громкости телерадиопередач проводилось на основании показаний измерителей уровня, регистрирующих максимальные величины электрического уровня сигнала (leveling). При этом было установлено правило: учитывая сравнительно узкий (до 40 дБ) динамический диапазон аналоговой аппаратуры того времени, зву- корежиссер должен был вручную строго поддерживать и нормировать уровень передачи по пикам сигнала, ориентируясь на максимальные показания измерителя уровня. Все элементы программы, вне зависимости от их содержания, «загонялись» в единый, достаточно узкий динамический диапазон, ограниченный сверху уровнем, превышение которого могло привести к перемодуляции передатчика. Такой метод поддержания уровня по дозволенному максимуму позволял улучшить в передаче отношение сигнал/шум. Это правило проведения аналоговых передач на радио и телевидении действует до сих пор.

Но при обмене программами между вещателями разных стран не всегда принималось во внимание, что в разных телерадиостудиях для контроля уровня звукового сигнала могут использоваться измерители уровня с различающимися техническими характеристиками. А показания этих при- боров сильно зависят от их баллистических (скоростных) характеристик. Приборы, даже совершенно одинаково откалиброванные по эффективному значению напряжения измерительного синусоидального сигнала, могут, если они имеют разное время интеграции (время, за которое прибор усредняет сигнал), на реальных программах давать существенно отличающиеся друг от друга показания уровня. Это трудно предусмотреть заранее, так как показания эти зависят от содержания программы, от ее временной структуры, то есть наличия в ней коротких выбросов и частоты их повторения. Исторически сложилось так, что в вещательных студиях стран Америки, Австралии и некоторых других в основном используются VU-метры (Volume Units meter, рис. 1), имеющие время интеграции tи =300 мс и относящиеся к измерителям уровня так называемых средних значений. Этот прибор из-за своей большой инерционности не успевает отреагировать на короткие импульсы уровня и игнорирует их. В качестве альтернативы VU-метру Международная электротехническая комиссия в документе IEC 60268-10, совместно с Европейским вещательным союзом (EBU), рекомендовала более быстродействующий прибор с малым временем интеграции (tи =5 мс). По международной классификации такие более быстродействующие приборы относятся к классу пиковых программных измерителей – РРМ (peak program meter, рис. 2).

Изм01

Изм02

Эти приборы дают звукорежиссеру возможность следить за самыми короткими из воспринимаемых на слух всплесками текущего уровня, которые при превышении допустимого предела могут вызвать неприятные нелинейные искажения. Правда, и эти приборы обладают некоторой инерцией, и поэтому на самые короткие, незаметные для слуха, пики сигнала длительностью менее 5 мс не реагируют. Поэтому более точное их наименование – QPPM, или измерители квазипиковых значений (quasi peak program meter). Измерители квазипиковых значений уровня звукового сигнала стандартизованы в России для измерений параметров звукового сигнала и применяются во всех отечественных студиях радиовещания и телевидения (ГОСТ 21185-75). Таким образом, в мировом вещательном сообществе еще со времен аналогового вещания не было единообразного подхода к контролю уровня звукового сигнала: и на радио и на телевидении вещатели разных стран ориентировались на одну из двух основных разновидностей приборов: либо на QPPM (квазипиковые), либо на VU-метры (средних значений). Вот в этом различии контрольных приборов и состояла одна из серьезных технологических проблем, затрудняющих унификацию уровней звукового вещания: более инерционные приборы занижали показания уровня, а приборы с меньшим временем интеграции, наоборот, завышали их.

Попытки выйти из этого положения предпринимались давно. Делалось это самыми разными способами. Например, на радио уже лет 40 тому назад применялись в вещании различные модификации автоматических регуляторов уровня – компрессоров и лимитеров (рис. 3).

Изм03

 

Чисто аппаратным методом предельно сжимался динамический диапазон передачи и «под одну гребенку» выравнивались пиковые значения сигнала по всей программе, без оглядки на ее содержание. До сегодняшнего дня на большинстве аналоговых ЧМ-радиостанций громкость в основном выравнивается этим самым примитивным способом – с помощью компрессирования и лимитирования. Такой способ проведения передач действительно может обеспечить постоянство максимального электрического уровня сигнала и дать возможность приблизительно выровнять среднюю громкость программы. Но подмена звукорежиссера автоматическим прибором проблему нормализации уровня передач кардинально не решает, ведь при этом нивелируются все художе- ственные нюансы звучания, передача становится «плоской» и невыразительной. Известно, например, что использование компрессии звука при демонстрации кинофильмов по телевидению приводит к снижению их привлекательности для телезрителей. Как показывают опросы телеви- зионной аудитории, любители кино в этих случаях просто отказываются от услуг телевидения и предпочитают воспользоваться альтернативой: ранее – прокатом DVD, в настоящее время – сервисом «видео по запросу» (VOD), предоставляемым интернет-телевидением (IPTV), скачиванием фильмов и сериалов с торрент-серверов, либо их онлайновым просмотром.

Таким образом, для высококачественного художественного вещания и, в первую очередь, телевизионного, автоматическое сжатие динамического диапазона и нормализация уровня по пикам представляются весьма сомнительными решениями. Даже «умные» автоматы, так называемые «стабилизаторы уровня», которые на основе анализа характера сигнала могут отличать музыку от речи и автоматически вносить необходимые поправки по их уровню, до сегодняшнего дня среди вещателей особого одобрения не получили, а вопрос их применения остается дискуссионным. Решение проблемы согласования показаний измерителей уровня с разными характеристиками было достигнуто только в начале 1990-х годов в результате разработки международных рекомендаций по использованию при калибровке вещательных трактов системы поправок к показаниям приборов, имеющих разное время интеграции. Так, в 1992 году Международный телекоммуникационный союз (ITU) опубликовал рекомендацию ITU-R BS. 645-2 – «Тест-сигнал и измерения для использования в международных каналах звукового вещания». В этом документе рекомендовалось настройку звуковых уровней в каналах вещания всегда производить по эталонному, так называемому выравнивающему или установочному сигналу (Alignment signal – AS). Этот синусоидальный сигнал частотой 1 кГц с уровнем Alignment level (AL) соответствовал нулевому показанию (0 дБ) по шкале самого инерционного из измерителей уровня – VU-метра. При калибровке канала по установочному уровню предлагалось учитывать тот факт, что прибор средних значений (VU- метр) на коротких пиках уровня (длительностью 5…10 мс) выдает существенно заниженные показания, а еще более короткие пики вовсе игнорирует. Это занижение показаний VU-метра на коротких пиках реальных программ может иногда достигать 9 дБ по сравнению с показаниями на синусоидальном установочном сигнале. Поэтому в точке канала, где уровень контролируется по прибору квазипиковых значений (QPPM), по шкале этого прибора необходимо иметь запас по уровню, некую «защитную зону» от перегрузки (headroom) не менее 9 дБ, предусмотрев ее при калибровке канала. Другими словами, диаграмму уровней надо установить так, чтобы уровень установочного сигнала (0 дБ по шкале VU-метра) соответствовал отметке -9 дБ по показаниям QPPM.

В этом случае на реальных фонограммах, независимо от того, каким прибором пользовался звукорежиссер при их создании, квазипиковые значения уровня по QPPM никогда не превысят 0 дБ, то есть своего номинального или максимально допустимого значения (PML, Permitted Maximum Level). Разница в 9 дБ (headroom) между уровнем установочного сигнала AL и номинальным, или максимально допустимым уровнем передачи PML хорошо знакома всем вещателям, но поправка в 9 дБ решала проблему только при аналоговых передачах. Однако с появлением новых технологий вещания рекомендация ITU-R BS. 645-2 потребовала дополнений. При переходе радио и телевидения на цифровое вещание можно было бы, наконец, ожидать решения проблемы громкости передач. Однако этого не произошло, более того, расширенный динамический диапазон цифрового сигнала эту проблему еще более обострил. Пришлось считаться с тем, что «цифра» в силу своей специфики требует нового подхода к измерениям текущего уровня. В цифровых цепях даже мгно- венные, неощутимые на слух пики уровня передачи становятся причиной сильнейших искажений, выражающихся в щелчках и треске. Поэтому не показывающий пики короче 5 мс квазипиковый прибор, вполне удовлетворявший по точности требованиям аналогового вещания, для контроля уровня цифрового сигнала оказался непригоден. Цифровой сигнал необходимо измерять практически безынерционным измерителем, реагирующим на импульсы длительностью менее 0,1 мс, то есть дающим возможность измерить мгновенные значения сигнала. Измерители мгновенных пиковых значений бывают двух типов: Digital peak meter, он же SPM (Sample peak meter), то есть «измеритель уровня пиков с точностью до отсчета (сэмпла)»; True peak meter, или «истинно-пиковый», то есть измеряющий в том числе и так называемые пики между отсчетами – intersample peaks (ISP). ISP – это пики аналогового сигнала, восстановленного по цифровым отсчетам, что предполагает (и чаще всего включает) передискретизацию (oversampling). Поэтому при стандартизованной для вещания частоте дискретизации 48 кГц измерения громкости должны производиться прибором с собственной частотой дискретизации 192 кГц.

Измерители мгновенных значений имеют шкалу, отградуированную в dBFS, то есть в децибелах относительно полной цифровой шкалы уровня сигнала. Этот уровень, обозначенный на шкале прибора отметкой 0 dBFS, является пределом, превышение которого вызывает цифровое ограничение (клиппирование) сигнала, сопровождаемое необратимыми искажениями. Необходимо учитывать, что это верно для измерения по SPM-приборам, особенность же истинно-пикового индикатора в том, что из-за межсэмпловых пиков уровень на индикаторе может немного пре- вышать 0 дБ, но клиппирования при этом может не происходить. Все зависит от качества оборудования: в хорошо спроек- тированных ЦАП клиппирование не происходит, а в дешевых – может иметь место. Измерения уровня цифрового сигнала имеют принципиальное отличие от измерений сигнала аналогового. Если определение уровня аналогового сигнала сводится, в конечном счете, к измерению величины его напряжения (реже – мощности) в децибелах по отношению к величине напряжения (мощности), выбранной за нулевое значение, то уровень цифрового сигнала ни вольтами, ни ваттами не определяется. Нельзя также уровень цифрового сигнала выразить в децибелах по абсолютной шкале в dBu, то есть по отношению к абсолютному нулевому уровню (0 dBu), за который принимается напряжение 0,775 В (эффективное). Цифровой сигнал физической размерности не имеет. Каждой выборке цифрового сигнала присваивается номер соответствующей зоны цифрового квантования. Общее число зон квантования и абсолютная ве- личина полной шкалы уровней цифрового сигнала определяются разрядностью квантования и зависят только от параметров конкретного АЦП. Но главная особенность измерителей уровня мгновенных значений заключается в том, что эти приборы из-за своей мгновенной реакции для контроля и регулирования громкости звучания при вещании вовсе не пригодны. Сфера их ис- пользования ограничивается чисто техническими функциями – калибровкой каналов передачи и контролем за пиками цифрового сигнала, чтобы эти пики никогда не превысили 0 dBFS, то есть точку клиппирования. Разумеется, показания таких приборов очень сильно отличаются от показаний приборов инерционных, поэтому внедрение в вещание цифровых технологий еще более усложнило проблему унификации поддержания уровней передач.

В настоящее время международный обмен программами, как правило, осуществляется в цифровом формате. Но при этом следует учитывать, что каналы передачи часто состоят из последовательно включенных как цифровых, так и аналоговых участков. При этом в студиях вещания и в различных вещательных организациях используются самые разные измерители уровня – и инерционные (VU, QPPM), и безынерционные (True peak). Таким образом, инженерам вещания пришлось решать новую задачу по согласованию цифровых и аналоговых уровней. Этому согласованию посвящены рекомендации, изложенные в документах Европейского вещательного союза (EBU) R68-2000 и американского Общества телевизионных и киноинженеров (SMPTE) RP 155-2004. Обе эти рекомендации основываются на уже существующем правиле калибровки всех звеньев тракта международных трансляций по эталонному синусоидальному установочному сигналу (AL), аналоговая величина которого должна быть выражена путем ее сопоставления с цифровой шкалой измерителя мгновенных значений, отградуированного в dBFS.

По рекомендации EBU R68-2000 установочный уровень по цифровой шкале должен быть ниже полной шкалы цифрового квантования на 18 дБ, то есть должен равняться -18 dBFS, а по американскому стандарту SMPTE RP 155-2004 тот же уровень по цифровой шкале должен равняться -20 dBFS. Эти величины цифрового значения установочного уровня мало отличаются друг от друга, поэтому обе рекомендации приняты и используются в разных странах. Однако, несмотря на то что все перечисленные международные рекомендации по калибровке каналов телевидения опубликованы, в том числе в Интернете, и широко всем доступны, на наших отечественных телевизионных каналах и поныне имеет место путаница в правилах поддержания уровней передач. Может быть, это частично происходит из-за того, что человеку, недостаточно знакомому с историей проблемы, трудно не запутаться в многочисленных переводах на русский язык рекомендаций по данной тематике, опубликованных в основном по-английски. Да и переводы этих документов часто выполнены так, что оставляют читателю возможность трактовать их текст достаточно вольно. Но самая главная причина постоянных скачков громкости, особенно заметных в передачах, в которых чередуются речевые и музыкальные фрагменты, лежит значительно глубже, нежели разнобой в используемых в разных странах измерителях уровня.

По мере совершенствования технологии вещания изменялись и методы контроля уровней передач, но в основном они оставались верными одному устоявшемуся принципу – с помощью приборов измерялись максимальные электрические значения уровня аудиосигнала, и по ним нормализовался уровень передачи. Но этот метод измерений и нормализации уровня аудиосигнала далеко не всегда дает звукорежиссеру возможность объективно оценить громкость и выровнять ее в передачах разных жанров таким образом, чтобы слушатель чувствовал себя комфортно. Дело в том, что на основании измерения максимальных величин электрического уровня аудиосигнала VU-метром или QPPM-метром и нормализации уровня по пикам проблема выравнивания громкости передач в принципе решена быть не может, так как субъективное восприятие слушателем громкости звука (loudness) далеко не всегда однозначно определяется величиной электрического уровня передачи (level).

Окончание следует

Авторы статьи: Борис Меерзон, Анатолий Вейценфельд