Звук в цифровом телевидении
В цифровом телевидении понятие сервиса является очень расплывчатым – сервисом называется любая полезная зрителю информация: изображение, звук, разнообразные данные. В статье речь пойдет о звуковых сервисах цифрового телевидения DVB (наземного, кабельного, спутникового). Большинство опубликованных к настоящему времени русскоязычных материалов о цифровом ТВ посвящено телевизионным сервисам. В то же время, благодаря тому, что в DVB используются транспортные потоки MPEG-2, возможна передача разнообразных звуковых сервисов.
Звуковое сопровождение изображения можно также рассматривать как звуковой сервис. Напомним, что в цифровом телевидении понятие сервиса является очень расплывчатым – сервисом называется любая полезная зрителю информация: изображение, звук, разнообразные данные. В статье речь пойдет о звуковых сервисах цифрового телевидения DVB (наземного, кабельного, спутникового).
Звук, подобно видеоинформации, передается в элементарных потоках MPEG в компрессированном виде. При этом в таблице PMT звук может быть описан и как отдельный звуковой сервис, и как входящий в состав сервиса телевидения. На иллюстрации приведен пример описания в РМТ звукового сервиса в составе телепрограммы, передающей звуковое сопровождение на разных языках, а также как отдельного звукового сервиса.
В составе таблицы РМТ содержится специальное поле (stream type), которое определяет тип передаваемого сервиса: видео, аудио, данные и т.п. Значения этого поля определяются стандартом MPEG-2 (ISO 31818), а также стандартом DVB ETSI EN 300468.
В табл. 1 приведены возможные значения поля stream type для звуковых сервисов.
Возможные способы компрессирования звука определены в спецификации ETSI для цифрового телевидения. Эта спецификация имеет номер ETSI TS 102154. Читающим по-английски желательно изучить эту спецификацию вкупе с упомянутым выше ETSI EN 300468 для получения полной информации об использовании звука в цифровом телевидении. Все эти документы доступны бесплатно на сайте ETSI (www.etsi.org) или на сайте консорциума DVB (www.dvb.org).
Из приведенной таблицы видно, какие именно способы компрессии разрешаются при использовании транспортного потока MPEG-2. Помимо ETSI TR 102154, существует спецификация для звуковых сервисов, передаваемых непосредственно через IP. К таким сервисам относится мобильное телевидение DVB-H, а также IPTV, распространяемое посредством широковещательных потоков. Для них разрешается использование профилей кодирования MPEG-4 AAC и HE AAC, а также AMR-WB+. Напомню, что профилями называются наборы «заводских» (то есть стандартных) установок кодера. Рассмотрим вкратце все эти способы звуковой компрессии.
Из указанных типов наиболее распространен кодер MPEG-1 layer 2. Рекомендуется использовать именно его, поскольку в этом случае обеспечивается совместимость с наибольшим количеством абонентских устройств, особенно дешевых. Стандарт MPEG-2 вносит некоторую неразбериху в кодирование аудио, вводя спецификацию MPEG-2 Audio (ISO 138183). Это вызвано тем обстоятельством, что, фактически, речь идет о расширении MPEG-1 Layer 2 для кодирования низкочастотных сигналов и обеспечения многоканального вещания. Необходимость появления MPEG-2 Audio связана с использованием многоканальных систем с раздельными дорожками СЧ-ВЧ и НЧ. Достаточное качество компрессирования СЧ- и ВЧ-звука обеспечивалось MPEG1 layer 2, а для низкочастотных сигналов специального профиля не было.
Стандарт MPEG-2 ISO 13818-3 такой профиль вводит и называет его MPEG-2 Audio. Таким образом, звук MPEG-2 Audio –это канал «басов» для сабвуфера. При компрессии по MPEG-2 Audio предусмотрены частоты сэмплирования не выше 24 кГц. Поскольку MPEG-2 Audio определяет способы компрессии дополнительных дорожек, то использование MPEG-2 Audio возможно с абонентскими устройствами, которые могут декодировать только MPEG-1 Layer 2. В этом случае дополнительные дорожки просто не декодируются. Помимо MPEG-2 Audio, стандарт MPEG2 определяет еще один способ компрессии звука, который называется MPEG-2 Advanced Audio Coding или ААС. ААС не совместим с MPEG-1 Layer 2 и дает лучшее качество звука при той же скорости потока. Иногда MPEG-2 Audio сокращенно называют MPEG-2 BC, а AAC –MPEG-2 NBC. BC означает back compatible, то есть имеется в виду обратная совместимость с MPEG-1, а NBC, соответственно, –non back compatible (не совместим).
В стандарте MPEG-4 определяется способ кодирования звука, который является дальнейшим развитием ААС и называетсяHE-AAC. HE означает – high effi ciency. Также в цифровом телевидении может применяться алгоритм компрессии звука AMRWB+, разработанный концерном 3GPP. Еще один способ компрессии – АС-3, разработанный Dolby Laboratories. MPEG1, MPEG-2 Audio и АС-3 стандартизированы для использования при передаче с применением транспортного потока MPEG-2. MPEG-2 AAC, HE-AAC и AMR-WB+ стандартизированы для использования в сервисах на базе IP, например IPTV или DVB-H. При этом декодеры звука должны поддерживать режимы Mono, Stereo (два канала) и Joint stereo.
Теперь рассмотрим, каким образом звук описывается в служебной информации транспортного потока MPEG-2, то есть в PSI/SI. Выше упоминалось о том, что в РМТ используется поле stream type для обозначения типа используемой компрессии. А каким образом описывается многодорожечная фонограмма, например, для вещания на разных языках? Для этого существует механизм дескрипторов – небольших «добавок» в PSI/SI, содержащих специфическое описание сервисов. Предусмотрены отдельные дескрипторы для описания сервисов, компрессированных по алгоритмам АС-3 и ААС. Для дополнительного описания сервисов служит дескриптор компонентов (Component descriptor), который содержит поля stream content и component type. Эти поля используются для более точного описания сервиса, дополняя поле stream type в РМТ.
Возможные значения дескриптора приведены в табл. 2. В отличие от поля stream type, дескриптор компонентов не является обязательным. Абонентское устройство может быть реализовано таким образом, что это поле ему не требуется для правильного декодирования. Но если ставится задача соответствия стандарту, то использовать этот дескриптор необходимо. Подробнее о значении полей дескриптора читайте в стандарте ETSI EN 300468 6.2.8.
В случае, когда вещание ведется на разных языках, каждый звуковой поток маркируется специальным дескриптором, который называется ISO 639 Language descriptor. ISO 639 – это международный стандарт кодов, обозначающих различные языки. Данный дескриптор помещается в SDT или РМТ для каждого звукового потока. Абонентское устройство декодирует этот дескриптор и указывает язык, на котором ведется вещание потока, что дает абоненту удобство в выборе звукового сопровождения на нужном языке. Разумеется, программное обеспечение абонентского устройства должно поддерживать такую возможность. Коды ISO 639 приведены в табл. 3.