Информационный портал ITSZ

Оригинал документа: http://spbit.su/news/n161759/


     
 

Субтитры получили второе дыхание

21.03.2014 07:00
20 марта 2014 года в Петербурге представители компании «Центр речевых технологий» (ЦРТ) рассказали о проекте «Субтитры». Созданный для него аппаратно-программный комплекс является единственным в России, а в мировом масштабе имеет лишь несколько аналогов подобного уровня. В «боевом» режиме решение успешно проходит проверку на Паралимпийских играх в Сочи.

Иван Вересов, исполнительный директор ЦРТ, рассказал, что проект «Субтитры» создавался при в рамках государственной программы «Доступная среда», которая обеспечивает реализацию прав, записанных в конституции, для людей с ограничениями по здоровью. Г-н Вересов отметил, что первые планы по созданию решения разрабатывались около шести лет назад.

Главная проблема субтитрования телепродукции заключается в том, что традиционными методами (без участия методов распознавания речи) сделать качественные субтитры очень сложно. Средняя скорость человеческой речи составляет около 800 зн/мин, а скорость печати – 300 зн/мин, поэтому такой вариант для создания субтитров не подходит. Также в России очень строгие нормативные требования к субтитрам: не допускаются орфографические и пунктуационные ошибки, тогда как в западных странах к этому относятся лояльнее и возможны небольшие неточности в тексте.

Однако человек адаптивнее к восприятию речи, чем компьютер, поэтому было принято решение о разработке комплекса, который бы сочетал в себе работу человека и компьютера. Первостепенной задачей, стоявшей перед ЦРТ, стало создание технологии автоматического распознавания речи. В мире есть несколько аналогов этого решения, но ЦРТ является компанией с полным циклом разработки. Помимо системы распознавания речи, «с нуля» было разработано ПО для трансляции передач прямого эфира с субтитрами, которое уже получило положительные отзывы от телеканалов ВГТРК, ТВЦ, а также от Всероссийского Общества Глухих. Также создано ПО для подготовки субтитров по монтажным листам с уже записанных передач.

Для полноценной работы решения требуются также два сотрудника со специальным образованием: редактор и респикер – синхронный переводчик, либо человек, окончивший специальные курсы эхоповтора. Наличие респикера обусловлено тем, что точность технологии распознавания речи составляет 94 %, а оставшиеся 6 % это различные шумы, помехи и фразы, которые компьютер не в состоянии воспринимать. Респикер же, слушая речь комментатора или любого другого человека, воспроизводит её в том виде, в котором она должна выводиться на экран. Работа редактора состоит в проверке материала и ручной корректировке неточностей.

Совместная работа компьютерных технологий и человека позволяет осуществлять субтитрование в режиме онлайн. Телевизионные передачи в прямом эфире идут с задержкой в среднем на 3 секунды. Кирилл Левин, директор научно-исследовательского департамента ЦРТ, отметил, что этого времени вполне достаточно для исправления неточностей без задержки субтитров. А что касается каналов интернет-вещания, то задержки, которая в среднем составляет 30 секунд, для «Субтитров» хватит с огромным запасом.

Эксперты ЦРТ посчитали пользу во времени при применении «Субтитров». Сегодня 1 час субтитров для передачи готовится примерно за 10 человеко-часов. При применении решения от ЦРТ это время сокращается до двух человеко-часов. Такой подход позволить каналам значительно экономить расходы на сотрудников: вместо штата в несколько десятков человек для подготовки качественных субтитров, можно подготовить несколько высококвалифицированных специалистов, которые будут осуществлять эту работу.

Михаил Досов, директор департамента развития продуктов, отметил, что проект «Субтитры» оказался очень востребованным не только у людей с ограничениями по здоровью, но также и у других слоев населения. Субтитры очень востребованы там, где можно смотреть телевизор, но, по различным причинам, нельзя включать звук или его не слышно. Примерами могут послужить больницы, аэропорты, поезда, шумные бары или рабочее место, когда сотрудник хочет посмотреть, например, трансляцию игры своей любимой спортивной команды, но начальник этого явно не одобряет.

Г-н Досов также отметил, что внедрение «Субтитров» значительно повышает рейтинг телепередачи – примерно в два раза. Поэтому в ЦРТ уверены, что в будущем технология найдёт массового заказчика. Интересным вариантом коммерциализации «Субтитров» может стать предложение рекламодателям сопровождать их рекламу субтитрами.  Учитывая огромные рейтинги спортивных программ и количество людей с проблемами слуха в нашей стране, производители считают это предложение очень перспективным в финансовом плане.

Иван Вересов отметил также, что, несмотря на то, что система уже работает, она будет дорабатываться, однако, выход на международный рынок не планируется, так как там есть крупные игроки, и занять их нишу на данный момент не возможно. В перспективе, возможно, будет реализована другая технология, которая позволит субтитрировать передачи на иностранных языках в русский язык. По мнению г-на Вересова, это позволит привлечь к зарубежному телевидению огромное количество телезрителей, которые не владеют иностранными языками.

Отметим, что ЦРТ работает уже 23 года и в «багаже» компании есть и другие высокотехнологичные предложения. Например, решение VoiceKey позволяет идентифицировать человека по голосу, используя его уникальные характеристики. По заявлениям разработчиков, это позволяет значительно уменьшить «пустую трату времени» на стандартные процедуры при звонке в контакт-центры. Компания, внедряющая в свой бизнес VoiceKey, избавляет своих клиентов от хранения в памяти огромного количества вспомогательной информации (пароли, кодовые слова). Подобная технология может использоваться также как дополнительная защита смартфона от несанкционированного доступа посторонних людей.

Автор: Сергей Мелешков (meleshkov@mskit.ru)

Рубрики: ПО, Безопасность

наверх
 
 
     

А знаете ли Вы что?

     
   
     


Copyright 2004 ITSZ. Все права защищены
Перепечатка материалов приветствуется при ссылке на www.ITSZ.spbit.su
Ресурс разработан и поддерживается компанией Peterlink Web