Распознавание речи - это технология, которая позволяет говорить на входе в системы. Вы разговариваете со своим компьютером, телефоном или устройством и используете то, что вы сказали как ввод, чтобы вызвать какое-то действие. Эта технология используется для замены других методов ввода, таких как ввод текста, щелчок или выбор другими способами. Это средство, позволяющее сделать устройства и программное обеспечение более удобными для пользователя и повысить производительность.
Существует множество приложений и областей, где используется распознавание речи, в том числе военные, в качестве помощи инвалидам (воображайте человека с калекой или руками или пальцами), в области медицины, в робототехнике и т. Д. В ближайшем будущем, почти все будут подвергаться распознаванию речи из-за распространения среди обычных устройств, таких как компьютеры и мобильные телефоны.
Некоторые смартфоны делают интересное использование распознавания речи. Примером этого являются устройства iPhone и Android. Через них вы можете инициировать обращение к контакту, просто получая устные инструкции, такие как «Call office». Могут также использоваться другие команды, такие как «Включить Bluetooth».
Проблемы с распознаванием речи
Распознавание речи в своей версии, известной как «Речь в текст» (STT), также использовалось в течение длительного времени для перевода произносимых слов в текст. «Вы говорите, он печатает», как сказал бы ViaVoice на своей коробке. Но есть одна проблема с STT, как мы ее знаем. ViaVoice является одним из лучших в отрасли, поэтому представьте себе остальное. Технология созрела и улучшилась, но речь в тексте все еще заставляет людей задавать вопросы. Одна из его основных трудностей - огромные различия между людьми в произношении слов.
В распознавании речи допускаются не все языки, а те, которые обычно не поддерживаются, а также английский. В результате большинство устройств, которые используют программное обеспечение для распознавания речи, работают только на английском языке.
Набор аппаратных требований затрудняет развертывание речи в определенных случаях. Вам нужен микрофон, который достаточно интеллектуальный, чтобы отфильтровать фоновый шум, но в то же время достаточно мощный, чтобы захватывать голос естественным путем.
Говоря об фоновом шуме, это может привести к сбою всей системы. В результате распознавание речи во многих случаях терпит неудачу из-за шумов, которые находятся вне контроля пользователя.
Распознавание речи оказывается лучше в качестве метода ввода для новых телефонов и коммуникационных технологий, таких как VoIP, а не как инструмент для массового ввода текста.
Приложения распознавания речи
Технология завоевывает популярность во многих областях и добилась успеха в следующем:
- Управление устройством, Просто говоря, «OK Google» на Android-телефон запускает систему, которая является ушами для ваших голосовых команд.
- Автомобильные Bluetooth-системы, Многие автомобили оснащены системой, которая соединяет свой радио-механизм с вашим смартфоном через Bluetooth. Затем вы можете совершать и принимать звонки, не касаясь смартфона, и даже можете набирать номера, просто произнося их.
- Передача голоса, В тех областях, где люди должны печатать много, какое-то интеллектуальное программное обеспечение захватывает их произносимые слова и записывает их в текст. Это актуально в некотором программном обеспечении для обработки текстов. Передача голоса также работает с визуальной голосовой почтой.