Microsoft вывел распознавание речи на уровень человеческой точности

29

0

Microsoft только что сделал еще один большой прогресс в области искусственного интеллекта.

Исследователи компании создали программное обеспечение для распознавания речи, которое может услышать речь настолько точно, как и люди. Разработка, подробно описываемая в статье, опубликованной в понедельник, раскрывает самое современное, по словам Microsoft, программное обеспечение распознавания речи на сегодняшний день, которое также установило предыдущий рекорд распознавания речи.

В исследовании программное обеспечение выдало частоту ошибок слов 5,9 процента, что примерно имеет такой же уровень, как и у человека.


1.jpg


Вот как Microsoft объясняет это:

"Новая исследовательская веха не означает, что компьютер распознает каждое слово безупречно. На самом деле, даже люди не могут этого. Таким образом, частота появления ошибок - или уровень на котором компьютер не правильно расслышал слово, как "есть" вместо "имеет" или перепутал артикли - такие же, как и следовало ожидать от человека, слушающего тот же разговор".

Ранее исследователи достигли частоты ошибок на 6,3 процента и уже нацелились на достижение человеческого уровня точности в последующем. Это было чуть больше месяца назад.

Само программное обеспечение основывается на глубоких нейронных сетях - технологии, которая интерпретирует данные подобно тому, как работает человеческий мозг, а также использует специальные графические адаптеры, которые позволяют программному обеспечению распознавать речь на высокой скорости, что ранее было невозможным.

Это достижение имеет далеко идущие последствия. На практическом уровне это означает, что продукты Microsoft в скором времени могут гораздо лучше понимать людей. Исследователи называют личный помощник от Microsoft - приложение Cortana и консоль Xbox, как два продукта, которые могли бы немедленно извлечь выгоду из исследования. Другое программное обеспечение, такое как службы мгновенной транскрипции, также может извлечь выгоду из улучшения.


cortana-1-1200x600.jpg


Разработка также может быть легко включена в инструменты Microsoft Office - представьте, насколько лучше станет функция голосового ввода в Word с уровнем распознавания, близким к человеческой точности.

Исследовательская группа ставит следующей целью выход на этап, когда программное обеспечение может не просто расшифровывать человеческую речь, но и понимать его.

Похожие посты

Регистрация прошла успешно