«Телевидение в кармане»: как работает мобильное вещание
Все больше пользователей предпочитает смотреть потоковое видео на мобильных устройствах, причем делать это не только дома, но и в дороге или на отдыхе — где угодно. Сегодня мы поговорим о технологии, которая позволяет им это делать.
На сегодняшний день разработано множество стандартов мобильного телевидения, но наиболее перспективными из них можно назвать те, что базируются на IP-протоколе. Опыт последних десяти лет отлично продемонстрировал как «гибнут», не успев появиться, стандарты эфирного мобильного ТВ, вроде DVB-H, и как динамично растет мобильное телесмотрение через интернет вслед за ростом числа смартфонов, планшетных компьютеров и других мобильных устройств.
Согласно недавнему исследованию, проведенному компанией Ericsson, к 2021 году порядка 70% всего мобильного трафика будет приходиться на видеоконтент. В компании отметили, что по их прогнозам годовой рост видеотрафика будет составлять примерно 55% вплоть до наступления 2021 года. Весомый вклад в столь бурное развитие вносят социальные сети и веб-сайты, активно встраивающие видеозаписи в свои страницы. Лидером среди видеосервисов по-прежнему остается YouTube, на долю которого приходится порядка 50-70% от общего объема видеотрафика.
Мобильное вещание: первое знакомство
Не «зависать», а адаптироваться
Адаптивное потоковое вещание — это один из способов доставки видеосигнала пользователю с достаточно высокой надежностью и качеством, подстраивающимся под постоянно меняющуюся скорость соединения. Это решение ориентируется также на тип конечного пользовательского устройства, его разрешение экрана, полосу пропускания интернет-соединения в данный момент, позволяя тем самым избавиться от «зависания» картинки, длительной буферизации и прочих неприятных моментов.
В процессе адаптивного вещания исходный источник видео высокого качества преобразуется путем энкодирования в широкий набор видеофайлов различного качества (битрейта), которые сохраняются для последующего распространения на сервере вещания или в сети доставки контента CDN. Когда пользователь решает воспроизвести адаптивное видео, сервер вещания отправляет ему в ответ так называемый файл манифеста (Manifest), в котором находится информация обо всех видеофайлах различного качества, имеющихся на сервере. Во время просмотра мультимедийный плеер на пользовательском устройстве может переключаться между различными разрешениями картинки, выбирая оптимальный битрейт, чтобы свести буферизацию медиапотока к минимуму.
Адаптивное вещание в Интернете на сегодняшний день представлено тремя крупнейшими технологиями: HTTP Live Streaming или HLS, разработанной компанией Apple, MPEG Dynamic Adaptive Streaming over HTTP (DASH) иMicrosoft Smooth Streaming (MSS). У каждой из них есть свои особенности и преимущества, на которых мы подробно остановимся.
Технология HLS
Данная технология, разработанная компанией Apple, работает путем кодирования на сервере исходного источника во множество сегментов различного качества. Видеоданные кодируются в формат H.264, аудиоданные — в MP3, HE-AAC или AC-3, после чего упаковываются в контейнер MPEG-2 TS для последующего распространения. Сформированный контент различного качества делится на серии 10-секундных фрагментов («чанков», — от англ. chunk — кусок), информация о которых заносится в файл манифеста/плейлиста с расширением *.m3u8.
Каждый пользователь получает индивидуальный плейлист, в котором присутствуют ссылки на главный файл манифеста, содержащий в себе информацию обо всех уровнях качества и расположении контента на сервере, что является необходимым условием для корректного выбора адаптивного качества/битрейта пользовательским медиаплеером. Когда начинается процесс воспроизведения, плеер инициирует последовательную загрузку 10-секундных «чанков». Первоначально он выбирает куски с низким качеством, а далее, основываясь на скорости пользовательского интернет-соединения, начинает загрузку видеофрагментов все более высокого качества.
Технология MSS
Компания Microsoft реализовала собственную технологию Microsoft Smooth Streaming, которая подобно HLS кодирует исходный источник на сегменты разного качества, однако здесь уже присутствует возможность выбора форматов в процессе кодирования. Так, видео может быть кодировано в H.264 или VC-1, аудио — в AAC или WMA. Полученные фрагменты упаковываются в контейнер MP4 с расширением файла *.ismv или *.isma.
В процессе кодирования на серверной части генерируются XML-файлы манифестов. Файл с расширением *.ism необходим серверу для описания доступных битрейтов, в то время как *.ismc используется клиентом, чтобы сообщить ему о доступных файлах различного качества и другую служебную информацию, необходимую для доставки контента, например, данные о длительности «чанка».
В отличие от HLS, технология MSS не кодирует последовательность «чанков» в различное качество, вместо этого сервер «нарезает» исходный файл на «чанки» так, как они будут впоследствии доставляться пользователю. Для этого требуется специально настроенный сервер, использующий Microsoft Internet Information Services (IIS).
Технология MPEG-DASH
MPEG-DASH является продуктом совместных усилий ведущих мировых игроков рынка адаптивного потокового вещания, таких как Adobe, Apple и Microsoft. В целом MPEG-DASH работает аналогично ранее описанным технологиям, однако отличается некоторыми особенностями доставки потока конечным пользователям. Здесь цельный доступный поток, состоящий из кусков медиафайлов и манифеста, именуется медиапрезентацией (Media Presentation). Файл манифеста получил название MPD (Media Presentation Description) и подобно M3U8 содержит метаданные обо всех доступных медиафайлах на сервере.
Отдельно взятый кусок медиапрезентации состоит из нескольких сегментов различного качества и битрейта, созданных для одного медиафайла. Каждый такой сегмент в MPEG-DASH называется периодом (Period) и представляет собой набор синхронизированного по времени содержимого (аудио, видео, экранных титров и так прочего), которое формирует полноценный просмотровый контент с одним уровнем качества. Период состоит из совокупности различных медиаформ, каждая из которых именуется адаптацией (Adaptation). Последующее кодирование конкретной адаптации называется представлением (Representation), которое после разбивается на короткие куски («чанки») дублированных сегментов.
Контент в MPEG-DASH упаковывается в контейнеры MP4 или MPEG-2, а вот кодеки, используемые для кодирования видео- и аудиосодержимого могут использоваться любые. При таком подходе вся ответственность, касающаяся корректного декодирования медиа потока, возлагается на плеер конечного пользователя. Это и является, пожалуй, основным преимуществом MPEG-DASH перед HLS и MSS, поскольку облегчает жизнь производителям и дистрибьюторам контента, избавляя их от необходимости его подготовки к адаптивному вещанию и исключая зависимость от проприетарного программного обеспечения, используемого в HLS и MSS.
Прямой эфир «по воздуху»
Технология многоадресного вещания LTE Multicast способна доставлять телевизионные сигналы в прямом эфире по беспроводной сети на мобильные устройства гораздо эффективнее одноадресного Unicast-вещания, поскольку множество пользователей может смотреть один и тот же мультикаст-поток, доставляемый вещателем. Основное экономическое преимущество данного способа доставки заключается в том, что мобильный оператор может использовать существующую инфраструктуру LTE-сети для организации услуг мобильного ТВ с минимальными финансовыми вложениями.
Помимо этого, еще одним преимуществом LTE Multicast является гибкость и спектральная эффективность. Количество радиочастотных ресурсов, отводимых под мобильное ТВ, определяется количеством каналов, транслируемых в то или иное время. К примеру, в прайм-тайм, когда количество телезрителей достаточно высоко, операторы могут передавать большее количество каналов за счет использования большей части частотного спектра. В рабочее время, когда спрос на мобильное ТВ заметно ниже, частотный спектр распределяется в пользу специализированных услуг мобильного оператора.
Мобильное ТВ посредством LTE Multicast дает мобильным операторам большие надежды для привлечения дополнительного дохода в будущем. Контент-провайдеры, в свою очередь, имеют возможность разрабатывать и внедрять новые инновационные приложения и услуги, которые будут полезны конечным пользователям. Пока данная технология в России находится в «зачаточном» состоянии, но технические возможности для ее развития имеются, спрос растет с каждым днем — рано или поздно это должно привести к тому, что просмотр эфирных телеканалов на мобильных устройствах станет столь же привычным делом, каким стал просмотр YouTube-видео на сегодняшний момент.