Для улучшения распознавания речи желательно иметь интернет подключение и кроме того нужно
установить языковый пакет для локальной работы с голосовым вводом.
Без локального языкового пакета при пропадании интернета приложение будет останавливаться и выдавать ошибку
Настройка "Использовать замены" позволяет заменять слова во время диктовки на подстановки (заменяющие слова), которые определены в .
Настройка "Управление заглавными буквами Google", отключает алгоритм Google простановки заглавных букв в словах (Google пока еще делает это с ошибками). Управлением заглавными буквами в этом случае осуществляется только голосовым блокнотом.
Список подстановок определяется для каждого языка голосового ввода. Хотя Google делает сам автоматическую подстановку знаков пунктуации для многих языков, добавление знаков пунктуации в этот список добавляет надежности в этих заменах. p.s. Невидимый символ перевода каретки в замены вводится нажатием клавиши "Return" (клавиша "Ввод").
Кроме знаков пунктуации в список замен можно добавить любые подстановки. Не стоит делать этот список чрезмерно длинным, так это может снижать производительность.
В заменах можно даже использовать регулярные выражения для языка Java. Например, замена со слова (^|\b)i($|\b) на слово I , будет заменять строчные одиночные буквы i, на прописные (такая замена предустановлена для английского языка).
В списке замен можно задать команду для отмены последнего произнесенного предложения (работает как кнопка "Отменить"). Для ее задания нужно в поле заменяющего слова ввести #1# . Активизирующее команду слово может быть любым.
Для редактирования подстановок используется короткое нажатие на элементе списка, для удаления - длинное.
В режиме редактирования может быть открыта клавиатура.
Работа в режиме редактирования
Для смены регистра первой буквы слова удобно пользоаться кнопкой "Cмены регистра". Для этого курсор ставят на нужное слово (или сразу за ним) и нажимают кнопку.
Если сети нет, то можно работать в автономном режиме, установив предварительно требуемый язык в настройках голосового ввода в разделе распознавание речи офлайн. Передачу данных в этом случае лучше вообще отключить.
При проставлении голосом знаков пунктуации в офлайн режиме перед ними появляется пробел. Чтобы он не появлялся можно добавить следующие замены в : [ ,] -> [,], [ \.] -> [.], [ !] -> [!], [ \?] -> [?], [ :] -> [:], [ ;] -> [;] (то есть пробел + запятая на запятую, пробел + экранированная точка на точку и так далее). Но нужно иметь в виду, что слишком большое число замен может понизить производительность.
Приложение имеет виджет, который автоматически включает распознавание при старте блокнота, а также может сразу открывать новый файл для записи (опция +
).
Если в работе приложения возникают ошибки, проверьте, что Google App установлено, обновлено и голосовой ввод использует его по умолчанию.
Во время диктовки всплывает сообщение "Ошибка на стороне сервера:..." - пропал интернет, а вы не установили пакет для локального ввода на этом языке. Установите его и ошибка исчезнет.
Нецензурные слова заменяются звездочками - в настройках приложения Google (Настройки -> Язык и ввод -> Голосовой ввод Google) включена Цензура . Отключите ее, если она мешает.
Не открываются *.txt файлы из файлового менеджера на Android 6 - дайте приложению доступ к файлам на устройстве (сделайте экспорт вначале).
На устройствах Meizu (и некоторых других) приложение не работает - разрешите приложению Google App работать в фоновом режиме, а не в режиме Смарт-Фон (Безопасность->Разрешения->Запуск в фоне)
При одновременной работе на нескольких устройствах переход на премиум на одном устройстве не сразу синхронизируется на других - дождитесь обновления кэша приложения google play market (сутки обычно)
Для того, чтобы распознать речь
и перевести её из аудио или видео в текст
, существуют программы и расширения (плагины) для браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны.
В этой статье мы рассмотрим два сервиса перевода речи в текст онлайн . Оба они работают по схожему принципу: Вы запускаете запись (разрешаете браузеру доступ к микрофону на время пользования сервисом), говорите в микрофон (диктуете), а на выходе получаете текст, который можно скопировать в любой документ на компьютере.
Русскоязычный онлайн сервис распознавания речи. Имеет подробную инструкцию по работе на русском языке.
Основной функционал сервиса:
В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?
Для теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты. Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.
Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):
Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!
Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Белое солнце пустыни»):
Отличный результат!
Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой! Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!
Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:
Друзья, понравился ли Вам данный сервис? Знаете ли Вы более качественные аналоги? Делитесь своими впечатлениями в комментариях.
Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.
Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше:)) несовершенство... На ней ещё нужно уметь быстро печатать!
Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня:)
Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде "Горыныча" и "Диктографа". Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево...
Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.
Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:
Как видим, преобразование речи в текст происходит в несколько этапов:
Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.
Со второй проблемой, увы, не всё так просто... Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!
В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.
Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API . Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях...
Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными... Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!
Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech :
Основное окно программы имеет максимально простой интерфейс - индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:
Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек "Команды", которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.
Вообще же MSpeech - довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании - компьютер должен быть подключён к Интернету для доступа к словарям Гугла.
Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.
Ну и, естественно, первым делом стоит упомянуть о "родном" сервисе Google под названием Web Speech API :
Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.
Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис "понимает" ещё и знаки препинания: если Вы скажете "точка" или "запятая", необходимый знак появится в форме вывода.
По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.
Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.
Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье;)
На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io :
В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку "Clear".
Как и сервис Google Dictation.io "умеет" ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.
Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет :
Главные преимущества сервиса:
Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.
Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.
Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.
Одним из лучших расширений для перевода речи в текст является SpeechPad :
Не совру, если скажу, что SpeechPad - один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:
Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт "SpeechPad". Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.
После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:
Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное . Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана...
Это наиболее популярная функция среди пользователей гаджетов.
Такой способ набора текста является более быстрым, удобным, освобождает руки для других занятий. Особенно распространено это среди социальных сетей для набора сообщения и поисковых машин для создания запросов разной сложности.
Как и любое другое программное обеспечение, набор текста голосом можно использовать для решения разных задач.
Дополнение Dictate – удобный и мультифункциональный инструмент.
По умолчанию он отсутствует в пакете MS Office и устанавливается как обычная программа. При этом по окончании процесса добавляется как новый подраздел в верхнем меню страницы.
Преимущества:
Пошаговая инструкция по установке:
При запуске текстового редактора появится новая вкладка «Dictation».
На данный момент есть очень большой выбор сервисов и программных приложений для голосового набора команд и управления.
Преимущества:
Для использования онлайн версии следует перейти на сайт https://speechpad.ru/, пролистать страницу вниз, включить запись и получить готовый текст. Для браузера потребуется скачать и установить расширение.
Инструкция по использованию:
Преимущества и возможности:
Пошаговая инструкция применения:
Достоинства:
Инструкция использования:
Преимущества:
Инструкция:
Достоинства:
Инструкция:
Как включить:
Как пользоваться:
Для активации необходимо:
По окончании активации в блоке ввода появится микрофон.
Для работы:
При произнесении фиксировать пунктуацию и разделение смысловых частей можно путем озвучивания знаков препинания.
Здравствуйте, дорогие читатели сайта "Семье на заметку!". То, что я сегодня буду советовать вам взять на заметку, пригодится не только любой семье (особенно где есть дети школьного и студенческого возраста), но и будет чрезвычайно полезно моим друзьям-блогерам. Недавно я познакомилась с голосовым блокнотом! Не слышали про такой? Это просто фантастика! Представляете, вы просто говорите, а компьютер тут же переводит все, что вы сказали в текст, и записывает словами на экране!
Экономия времени при использовании голосового блокнота налицо, особенно для тех, кто не очень быстро печатает на компьютере. К тому же открываются новые возможности: вы можете говорить, к примеру, на русском языке, а голосовой блокнот будет тут же переводить вашу речь на английский или другой язык, который вы зададите, то есть он будет работать еще и переводчиком !
Блокнот для речевого ввода может даже расставлять знаки препинания . Но для этого ему надо говорить словами "точка", "запятая", "вопросительный знак", "новая строка" и т. д. И даже новое предложение после точки он будет начинать с заглавной буквы!
Теперь у вас будет возможность перевести аудио в текст , и даже звук с ролика из youtube , если речь там достаточно четкая. Но даже если речь нечеткая и с помехами - тоже есть выход: слушать в наушниках, и повторять то, что слышите. В любом случае, это будет быстрее, чем просто набирать текст вручную.
Представляю, какая это помощь фрилансерам, которые зарабатывают как раз переводом речи в текст!
Посмотрите коротенькое видео, чтобы вам понять, как это работает:
Еще одна замечательная особенность голосового блокнота SpeechPad - это то, что таким образом вводить текст голосом можно в любое окно, где нужно писать текст .
К примеру, в строке поиска Yandex или Google. Для этого в строке поиска нужно щелкнуть правой мышкой, и из выпадающего списка выбрать "SpeechPad".
Вверху возникнет окошко, запрашивающее разрешение на использование вашего микрофона. Отвечаете "Разрешить", и говорите голосом то, что хотите найти в поиске. В строке поиска напишется то, что вы сказали!
На заметку блогерам : точно так же вы можете диктовать комментарии, посещая другие блоги!
Качество перевода речи в текст зависит, во-первых, от того, насколько эта речь четкая, а во-вторых, от вашего микрофона. Регулируя эти параметры, можно получить более хороший результат.
Если у вас на компьютере установлен браузер Google Chrome, то бесплатно установить голосовой блокнот SpeechPad не составит никакого труда.
Там же есть и инструкция, и подробные видеоуроки с объяснением всех функций и возможностей блокнота. Кто заинтересуется, тот разберется во всех деталях.
Я уверена, что каждый сможет найти достойное применение этому блокноту, и он станет настоящим помощником тем, кому это необходимо!
А вы как считаете? Жду ваших отзывов и комментариев!
А теперь по традиции для вас небольшая порция позитива!
Это невероятно! Вы только посмотрите, насколько грациозен крокодил в прыжке!
● Рассадочные карточки с фото гостей
Рассадочные банкетные карточки служат отличными помощниками в правильной рассадке гостей за праздничным столом на юбилеях, корпоративах или свадьбах. Организаторы торжества могут спокойно заранее продумать где кому...