От автора: YouTube усовершенствовал систему автоматической генерации субтитров. Теперь она умеет распознавать не только человеческую речь, но и окружающие звуки. Расширение возможностей функционала ориентировано, прежде всего, на пользователей с нарушением слуха.
Пока система автоматической генерации субтитров «научилась» распознавать всего несколько «внешних» звуков: играющую музыку, смех и аплодисменты. Для анализа аудиодорожки используются алгоритмы, созданные на основе технологии машинного обучения.
Отмечается, что со временем масштабы распознаваемых звуков будут расширяться. В ближайшем будущем система сможет выделять из общего аудиопотока звон, стук и лай собак. Но для этого потребуется некоторое время, пока алгоритмы системы самостоятельно не обучиться их понимать.
Функционал для создания субтитров к публикуемым роликам появился в YouTube в 2006 г. Через три год была запущена система автоматической генерации субтитров. В 2012 она стала доступна и для русскоязычных издателей контента.
Источник: //www.theverge.com/
Редакция: Команда webformyself.