Искусственный интеллект и телевидение

Организаторы выставки и конференции IBC в преддверии очередного форума публикуют на своем сайте статьи о технологиях, меняющих ландшафт цифровых медиа. Нам показался любопытным материал, обобщающий достижения в области искусственного интеллекта (ИИ) в медиабизнесе – начиная от работы новостных редакций и заканчивая телевизионным производством. Автор статьи (ее оригинальное —название Artificial intelligence gets creative), Адриан Пеннингтон, задается вопросом: может ли ИИ вообще заменить людей в цифровых медиа? Предлагаем вашему вниманию перевод материала с небольшими сокращениями.

Мы привыкли думать о телевидении как о творческой индустрии, но она уже сейчас чрезвычайно автоматизирована. Сценарист еще только обдумывает идею, а уже есть точно сформулированные представления, на уровне методологии, как будет двигаться роботизированная камера и как будет проверяться качество отснятого материала – кстати, машины справляются с этим лучше людей. Ключевое слово здесь — «индустрия», а не «творчество».

Немного осталось отраслей, которые совсем не затронули ИИ и машинное обучение. Но средства массовой информации, где запись, обработка и передача информации не обходятся без соответствующего программного обеспечения, оказываются особенно восприимчивыми к когнитивным технологиям. Это ставит практические вопросы, в какой степени машины могут или даже должны вытеснять человека из творческих областей, а в более философском аспекте – какова природа самого творчества.

Одна из точек зрения состоит в том, что творцы с помощью технологий смогут тратить больше времени на творчество как таковое. Другие идут дальше и заявляют, что в конечном итоге контент, созданный без участия человека, будет неотличим от традиционного.

ИИ ЗАХВАТЫВАЕТ РЕДАКЦИИ

В медиа никто не использует ИИ больше, чем новостные СМИ. В недавнем отчете Reuters говорится, что почти три четверти опрошенных новостных СМИ уже используют ИИ в какой-либо форме. В частности, алгоритмы ИИ применяются для автоматизации фактчекинга, ускорения тегирования и работы с метаданными, а также в маркетинговых целях.

Новостные СМИ знают, что им нужно делать больше контента с меньшими затратами: они должны найти способы повысить продуктивность журналистов, но так, чтобы те не выгорали. Автоматизация на основе ИИ – один из способов добиться желаемого.

Так, британская Ассоциация прессы (Press Association, PA) запустила сервис Urbs Media, который предоставляет сотни полуавтоматизированных сюжетов для местных газетчиков. Теперь журналист может написать исходный текст, обратившись к одному из нескольких источников общедоступных данных (например, к медицинской статистике или демографическим данным), а затем Urbs Media на основе этого сюжета автоматически создает его локализованные версии для множества местных публикаций.

Другой пример использования ИИ в новостях – отчеты с конференций и форумов. Китайский технологический гигант Tencent разработал автоматизированную программу Dreamwriter, которая преобразует живые выступления спикеров в текстовые отчеты. Предположительно, Dreamwriter ежедневно выдает 2500 сюжетов.

BBC заявляет, что в настоящее время корпорация не публикует истории, созданные робо-журналистами. Но исследовательская группа в структуре BBC под названием News Labs разрабатывает инструменты автоматизированной обработки интервью и выявления необычных тенденций в открытых данных, сообщил редактор в News Labs Роберт Маккензи (Robert McKenzie).

Подобным же образом автоматизация используется для компоновки пакетов видеоновостей. Испанский телеканал RTVE тестирует ИИ-программу разработчика VSN, которая может за считанные секунды собрать фрагменты архивного видео в последовательный таймлайн.

В компании MAM software, которая специализируется на средствах подготовки новостей для вещателей, полагают, что искусственный интеллект будет дополнять, а не заменять человека на посту редактора.

«Дополнительная ценность возникает, когда несколько платформ ИИ объединяются с человеческим интеллектом для выхода на уровень, который раньше не мог быть достигнут», — рассуждает директор по стратегии продукта Dalet Кевин Савина (Kevin Savina).

Например, в ньюсруме когнитивные технологии могут использоваться для автоматической маркировки тысяч фрагментов архива. Для создания расширенного поискового запроса могут также применяться технологии ИИ для распознавания лиц и объектов. Другое инструмент ИИ мог бы затем рекомендовать отобранные фрагменты по таймлайну таким образом, чтобы это наилучшим образом раскрывало сюжет, над которым работает журналист.

«Но даже в этом случае вам нужен фильтр в виде решений, принимаемых журналистом. Только если у вас есть комбинация из нескольких инструментов ИИ, а также живые сотрудники, отбирающие, что интересно, а что нет, возникает непрерывная обратная связь, позволяющая оттачивать ИИ», — поясняет Савина.

«Каталогизация и поиск контента – задачи, требующие систематического участия. Использование ИИ в медиа означает, что журналисты могут больше фокусироваться на действительно креативных задачах, больше свойственных редактированию», — дополняет менеджер по продукции VSN Тони Вилальта (Toni Vilalta).

Чаще всего использование ИИ – слишком дорогое удовольствие, чтобы конкретный инструмент разрабатывался для использования только в одной медиаорганизации. К тому же результаты работы требуют проверки, им нельзя безоговорочно доверять. А для компаний, которые думают о кооперации своих сотрудников и ИИ, возникает проблема управления изменениями. «Внедрение ИИ — это как наем нового сотрудника. Вам нужно научить его, как работать в организации, а коллегам необходимо соответствующим образом адаптироваться к нему», — объясняет Кевин Савина.

АВТОМАТИЗАЦИЯ СПОРТИВНОГО ТЕЛЕВЕЩАНИЯ

ИИ, скорее всего, ожидает большое будущее в спортивном телепроизводстве. Многокамерные дистанционно управляемые системы, охватывающие все игровое пространство, доступны на рынке уже много лет. Продвинутые автоматизированные алгоритмические технологии, например, используемые в системе Pixellot, отслеживают ход игры, выделяют основные моменты, генерируют повторы и вставляют рекламу без участия человека. Теперь Pixellot может автоматически определять ключевые моменты соревнования, что «на один шаг приближает технологии к сквозному телевизионному производству по безлюдной технологии», поясняет генеральный директор Pixellot Алан Вербер (Alon Werber).

Другие разработчики, среди которых Tedial и TVU Networks, предлагают связывать спортивное live-видео с соответствующим контентом из архива, анализируя метаданные в реальном масштабе времени с помощью ИИ. Подобные инструменты можно было бы объединить с информацией о предпочтениях и устройствах конкретного зрителя для автоматизированного создания и распространения персонализированного контента — сегодня ни один живой сотрудник не в состоянии это сделать. Но развитие в этой области находится на начальном этапе и пройдет еще много времени, прежде чем эти технологии займут свое место в производстве самых рейтинговых программ вроде «Матча дня» (Match of the Day). «Качество контента резко падает, если от ИИ требуется принимать здравомыслящее решение. Если вы готовы создать тысячу разных версий одного и того же видеоряда, тогда использование ИИ, вероятно, будет более экономически выгодным, чем работа штатного сотрудника. Но если вы пытаетесь выдать контент вещательного качества, безрассудно было бы полагать, что машина сможет приблизиться к профессионалам», — делится мнением Сэм Богоч (Sam Bogoch), глава компании Axle AI, специализирующейся на использовании ИИ в видеотехнологиях. Но он добавляет, что считает вполне вероятным, что редакторы в будущем будут на самом деле управлять ИИ-ботами. Как бы то ни было, по мере того, как ИИ учитывает все больше и больше данных, телепроизводство будет все больше и больше автоматизироваться.

«Если трансляция принципиально изменится и вместо единого сюжета для всех будут создаваться миллионы версий для отдельных зрителей, где в исходное видео вносится бесконечное количество дополнений и перестановок, тогда ИИ будет играть огромную роль. В этом сценарии роль редактора будет заключаться в том, чтобы сформировать исходный сюжет и позволить ботам ИИ выполнять оставшуюся работу», заключает Богоч.

BBC НА ПУТИ К СМАРТ-ТЕЛЕПРОИЗВОДСТВУ

«ИИ необходим нам для поддержания государственного информационного сервиса на мировом уровне, в то же время нам необходим информационный сервис мирового уровня для оттачивания ИИ», — подчеркивает глава отдела технологий и продуктов BBC Мэтью Постгейт (Matthew Postgate). В частности, BBC изучает, насколько хорошо машина может отбирать качественные фрагменты съемки при редактировании видеоматериала по сравнению с человеком. «Цель состоит в том, чтобы автоматизировать больше процессов и охватить больше контента, а не сократить персонал», — подчеркивает отдел R&D BBC в корпоративном блоге. Так, в компании разработали систему, которая автоматически кадрирует картинку с высокой разрешающей способностью, полученную от UHD-камер при редактировании сюжета. Система может управляться вручную, чтобы, например, менять монтажные склейки кадров за счет подстройки частоты склеек. Тесты в BBC показали, что прототип системы уже может создавать сюжеты на уровне «достаточно близком к профессиональному редактору, по крайней мере, для простых событий». Помимо этого, BBC изучает, как ИИ может готовить заготовки для редактирования сложных программ и сюжетов.

В компании признают, что редакторское ремесло является «глубоко творческим», но исходят из того, что базовая задача редактора обычно состоит в отборе наилучшего материала из всего имеющегося. Сортировка отснятого для поиска хороших кадров — это не лучшее использование времени редактора, или, по крайней мере, не самая творческая часть его работы, говорят в BBC. «ИИ мог бы помочь автоматизировать решение этих редакторских задач», — добавляют в компании.

УПОЛНОМОЧЕННЫЙ ПО ИИ

Ключевые игроки рынка онлайн-контента, такие как Netflix, внедряют интеллектуальный анализ данных в свой бизнес, в частности, для того, чтобы на основе информации о предпочтениях аудитории создавать оригинальный контент.

Британский разработчик Epagogix помогает голливудским студиям распределять сценарии по категориям «выстрелит» или «провалится», прогоняя их через соответствующие алгоритмы. В компании утверждают, что их технология способна просчитывать инвестиционные риски, прогнозируя сборы фильмов, снятых на основе разных сценариев.

А в BBC провели эксперимент, направленный на использование ИИ и машинного обучения для ревизии обширного архива ВВС, чтобы отыскать в нем контент, ориентированный на высоколобых зрителей канала BBC4. «ИИ отыскал в архиве контент, на который мы, возможно, не обратили бы внимание», — рассказывал редактор BBC4 Кассиан Харрисон (Cassian Harrison) на конференции RTS. В блоге BBC он позже написал, что люди способны воспринимать нюансы, у них есть вкусы и личные предпочтения — качества, которых лишены алгоритмы и машины. Но это не мешает технологиям помогать работать с нюансами и предпочтениям.

В то же время компания Novamente работает над созданием «платформы знаний» в университете Южной Калифорнии, предназначенной для анализа восприятия аудиторий телевизионных сценариев. «Цель состоит в том, чтобы связать воедино сюжетные повороты и нарратив с персонажами и узнать, вызывают они резонанс в аудитории или нет», — объясняет генеральный директор Novamente Ив Берквист (Yves Bergquist). Он прогнозирует, что в долгосрочной перспективе зрители получат много массового контента, созданного автоматизированным способом; с другой стороны, чем выше уровень контента, тем меньше автоматизированным будет его производство.

ИИ С ФАНТАЗИЕЙ

Netflix использовал ИИ для воссоздания незавершенного фильма Орсона Уэллса «Другая сторона ветра» (The Other Side of the Wind). Фильм снимался в 70-х, но не был смонтирован и выпущен в прокат. Netflix смонтировал чистовую версию из исходного отснятого материала и перевел ее в 4K по технологии Technicolor, а затем прогнал фильм через ИИ-систему, чтобы улучшить разрешение каждого кадра перед выпуском релиза, который состоялся в 2018 голу. «Все опасаются, что ИИ захватит планету и разрушит промышленность, но я смотрю на это с другой точки зрения, — говорит Алекс Жуков (Alex Zhukov), технический директор компании Video Gorillas, ИИ-инструменты которой были использованы в проекте Netflix. «Когда Орсон Уэллс делал свой фильм, негатив буквально приходилось резать, чтобы редактировать его. Теперь этой профессии не существует. Так и с ИИ. Все промежуточные стадии ручной работы над контентом уйдут, но появятся другие возможности, которые позволят нам создавать контент, который нам пока недоступен», — рассуждает Жуков. Он настаивает, что ИИ способен создавать произведения искусства. Но открытым остается вопрос, может ли искусственный интеллект создавать искусство, неотличимое от творений человека.

В Microsoft пытаются по-своему ответить на этот вопрос. Компания разработала бот ИИ, который может создавать почти идеальные пиксельные изображения исключительно по текстовому описанию. Каждое изображение содержит детали, которые отсутствуют в тексте, что указывает на то, что у ИИ есть искусственное «воображение». «Бот узнает, что люди называют здравым смыслом из данных, на которых он обучается, и это знание используется для создания деталей изображения, которые существуют только в воображении», — поясняет исследователь Microsoft Сяо Дун Хе (Xiadong He). В Microsoft ожидают, что ИИ с достаточной вычислительной мощностью сможет синтезировать художественный фильм, и для этого цифровому режиссеру не потребуется ничего, кроме сценария.

Facebook также использует нейронные сети, чтобы создавать изображения, утверждая при этом, что в 40% случаев опрошенные люди ошибались, полагая, что видят фотографию реального объекта, а не компьютерную графику. Google делает что-то похожее, обучая машины отыскивать уже знакомые шаблоны на фотографии, улучшать их, а затем повторять процесс. Результат — своего рода «машинное абстрактное искусство», как это назвали в журнале Wired.

Возможность создания музыки на основе ИИ также заставляет энтузиастов смотреть в эту сторону. Facebook разработал технологию, в которой, как утверждается, ИИ генерирует целые песни, стоит ему лишь насвистеть мотивчик. Речь идет о проекте Facebook Artificial Intelligence Research (FAIR) — это часть более масштабного исследования, направленного на создание саморегулируемого сообщества искусственных интеллектов. Подобно боту-художнику у Microsoft, этот проект исследует структуры, созданные на основе случайности или импровизации, которые в разное время вдохновляли людей на творчество.

Искусственному интеллекту FAIR по-прежнему требуется образец для создания музыкального произведения — например, фортепианная пьеса в стиле Бетховена. Но разработчики намеренно искажают музыкальный источник, меняя его, чтобы добиться менее контролируемого и более спонтанного результата.

«Мы пытаемся создать ИИ-инструменты, помогающие создавать музыку», — говорит Эд Ньютон-Рекс (Ed Newton-Rex), основатель и исполнительный директор компании Jukedeck, предлагающей бесплатную платформу для музыкального продакшна. Он рассказывает, что Jukedeck, способная создать уникальную композицию всего за 20 секунд, все чаще используется создателями видеороликов, различными брендами и независимыми продюсерами для социальных сетей, подкастов и игр.

Платформа также использовалась в проекте Zone Out — короткометражном фильме, от сценария до монтажа сгенерированным искусственным интеллектом всего за 48 часов. В проекте ИИ отталкивался от научно-фантастических фильмов для создания сценария, отбирал кадры из фильмов с открытыми авторскими правами, дополняя их съемками профессиональных актеров на фоне хромакея.

Таким образом, четкой границы между наукой и искусством уже не существует.