Система распознавания речи Microsoft по уровню точности сравнялась с распознаванием речи живым человеком, заявили в компании. Существенно улучшить результат помогла разработка резидента «Сколково» компании «ЦРТ-инновации» (Группа ЦРТ) в области искусственного интеллекта. Согласно статье по автоматическому распознаванию телефонных разговоров американцев, опубликованной группой исследователей Microsoft, ошибка распознавания речи составила 5,9%. Это означает, что более 94% слов система распознаёт верно, как и профессиональные стенографисты в аналогичных условиях. «Мы достигли уровня человека. Это историческое достижение», — комментирует полученный результат главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang). «Достижение уровня точности распознавания речи, сопоставимый с точностью человека, – важный шаг к созданию новых технологий и продуктов, направленных на решение задач автоматизации предоставления сервисов и обеспечения безопасности», – считает Сергей Ходаков, руководитель направления «Безопасные информационные технологии» ИТ-кластера Фонда «Сколково».В проведенных ранее экспериментах по распознаванию на стандартном наборе тестов «НИСТ-2000» корпорации удалось снизить уровень ошибки до 6,3%. Последний рывок в повышении качества распознавания на 0,4% ученые сделали в середине октября, модернизировав архитектуру искусственного интеллекта, основанного на нейронных сетях. Наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 года в Сан-Франциско, говорится в статье исследователей из Microsoft. «Мы использовали моделирование человеческого языка многослойными рекуррентными нейронными сетями с блоками долговременной и кратковременной памяти (long short term memory). Они позволяют учитывать дальний смысловой контекст в предложениях. Это заметно снижает количество ошибок распознавания», – поясняет суть разработки Кирилл Левин, руководитель научно-исследовательского департамента ЦРТ. На сегодняшний день набор алгоритмов, разработанный учёными группы ЦРТ, занимает третье место в мире (после IBM и Microsoft) по качеству распознавания речи американцев в лабораторных условиях. «Признание технологий разработанных “ЦРТ-инновации” со стороны ведущий компании является отличной рекомендаций, подтверждающей инновационность и высокий коммерческий потенциал российских разработок. Это достижение поможет нашему резиденту укрепить свои позиции в России и успешно продолжить коммерциализацию на международном рынке», – подчеркивает перспективность российских технологий Сергей Ходаков. Раннее крупный американский банк Wells Fargo (WF) получил премию Most Innovative Feature Award за внедрение разработки компании «ЦРТ-Инновации» – биометрического доступа VoiceKey.OnePass. Компания входит в Группу ЦРТ —российскую группу IT-компаний, специализирующуюся на проектировании, разработке и внедрении решений в сфере технологий синтеза и распознавания речи, мультимодальной биометрии, анализа больших данных, искусственного интеллекта, машинного обучения, анализа аудио- и видеоинформации.
http://polit.ru/news/2016/10/31/sk_microsoft_crt/