Как включить и настроить голосовой ввод текста на телефонах Андроид и ПК

Голосовой блокнот позволяет вводить текст, используя микрофон, а также переводить речь из аудио и видео в печатный текст. В настоящее время голосовой ввод возможен только в браузере Chrome для OS Windows, Mac и Linux (для пользователей Андроид и iOS разработаны специальные Android, iOS приложения). Для работы сервиса рекомендуется использовать внешний микрофон неплохого качества.

Голосовой набор текста

Нажмите кнопку “включить запись”. При первом посещении сайта вверху браузера возникнет панелька с просьбой разрешить доступ к микрофону. Нажмите там кнопку “Разрешить” Говорите в микрофон Кнопка A/a меняет регистр первой буквы слова, рядом с которым находится курсор Кнопка Отменить удаляет из результирующего поля последний введенный фрагмент Кнопки пунктуации служат для ввода знаков с помощью мыши Текст в результирующее поле добавляется после последней позиции курсора. Если был выделен фрагмент текста в результирующем поле, то введенный текст будет его заменять Установка флажка Отключить управление заглавными буквами Google отменяет простановку заглавных букв анализатором Google. Если отмечен флажок Заменять слова пунктуации, то слова в голосовом вводе, совпадающие со знаками препинания, будут заменяться на эти знаки. Соответствующие слова можно увидеть, если навести мышь на кнопку знака. *В настоящее время Google самостоятельно заменяет слова: точка, запятая, вопросительный и восклицательный знаки, поэтому при отключении флажка замена все равно может проводиться. Смена языка для голосового ввода осуществляется выбором соответствующего языка в выпадающем списке. Если языка нет в списке, но он поддерживается для голосового ввода, то его можно добавить в кабинете пользователя (доступен после регистрации) Если отмечен флажок Выполнять команды, то во время ввода текста можно давать команды голосом. Если отмечен флажок Вывод в буфер обмена, то текст будет поступать не в результирующее поле, а в буфер обмена. Флажок работает только при установленном расширении блокнота. Если отмечен флажок Возобновлять при ошибках, то запись не будет отключаться самостоятельно при ошибках и длительном молчании. –> Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла.

Ввод текста голосом любое поле ввода! Интеграция с Windows, Mac и Linux

Установив расширение для голосового блокнота, вы получите возможность вводить текст голосом в любое поле ввода напрямую. Добавив модуль интеграции c Windows, Mac или Linux, вы обеспечите прямой голосовой ввод во все приложения в этой OS.

Перевод аудио в текст

Кнопка Транскрибация включает панель воспроизведения звуковых и видео файлов. В настоящее время в голосовом блокноте доступен перевод аудиотекстов из форматов html5 видео и аудио, а также из видеозаписей youtube. Для форматов html5 видео и аудио необходимо указать URL медиа файла, для воспроизведения записи youtube нужно ввести ID этой записи в Youtube. После чего следует нажать на кнопку включить запись.

Снятие флажка Запускать синхронно с записью в модуле транскрибирования дает возможность самостоятельно проговаривать прослушиваемые фрагменты аудио или видео (при использовании наушников). Данная опция крайне полезна при плохом качестве роликов, когда автоматическое распознавание невозможно.

Видео инструкции по работе с системой

Обучающие видео по работе с голосовым блокнотом.

Приложения для голосового блокнота

Для удобства работы можно установить приложение CHROME или воспользоваться возможностями CHROME по созданию ярлыков приложений для запуска блокнота с предустановленными параметрами.

<label>Язык голосового ввода </label><label> Уровень звука</label>  Уровень распознавания <label> Отключить звуки</label><label>Длина буфера фраз  </label><label>Пауза в речи  </label><label>Интервал перезагрузки в символах ?</label> <label> Возобновлять при ошибках</label><label> Выполнять команды</label><label> Отключить управление заглавными буквами Google</label><label> Заменять слова пунктуации</label><label> Вывод в буфер обмена</label><label> Интеграция с OS (выкл)</label>?<label> Добавлять в конец текста</label><label> Простой режим Google</label>?<label> Пунктуация в Яндекс</label>

–>

Для многих из нас скорость работы имеет первоочередное значение. Особенно это важно в отношении набора текстов, которые требуется подготовить к определённому сроку. Если вы печатаете медленно, набор больших объёмов может превратиться в одно сплошное мучение, оканчивающееся изнурением, усталостью и головной болью. Действенной панацеей могут стать способы, позволяющие продиктовать предложения через online-сервисы и получить на выходе файл в формате doc или txt. Ниже мы приведём ТОП-4 способов, позволяющих выполнить набор текста голосом в сети. А также поясним, что нам для этого понадобится.

Содержание

Способ №1. Speechpad.ru — ввод текста речью онлайн

Ресурс speechpad.ru – один из наиболее популярных инструментов для превращения голоса в текстовый файл. Сервис позволяет надиктовывать предложения онлайн как напрямую, так и использовать возможности транскрибации. Последняя позволяет считывать речь из видео и аудио файлов. Сервис поддерживает работу с 11 языками (включая русский и английский), автоматическое управление заглавными буквами. Для работы с сервисом понадобится браузер Google Chrome.

Выполните следующее:

  1. Перейдите на speechpad.ru;
  2. Выберите язык голосового ввода, на котором вы будете надиктовывать текст;
  3. Нажмите на кнопку «Включить запись» (при необходимости предоставьте сервису доступ к микрофону, нажав на «Разрешить»);
  4. Надиктуйте свой текст;
  5. В конце нажмите на кнопку «Отключить запись»;
  6. Сохраните результат, нажав на «Скачать» ниже.

transcribation.jpg

Если вам понадобится провести транскрибацию нужного аудио или видеофайла, нажмите внизу на кнопку «+Транскрибацию», и загрузите нужный файл на ресурс для проведения процедуры.

Это интересно: Голосовой переводчик онлайн.

Способ №2. Speechtexter.com — сервис для голосовой диктовки

В наш топ способов для осуществления речевого ввода предложений online мы включили и сервис speechtexter.com. Последний поддерживает более чем 60 языков диктовки, точность его распознавания составляет более 90% (для English USA – более 95%), имеется возможность сохранения надиктованного результата в формате txt и doc. Благодаря гибкому функционалу сайта вы можете самостоятельно добавлять на него нужные команды для работы с пунктуацией.

Для работы с ресурсом выполните следующее:

  1. Откройте speechtexter.com;
  2. Нажмите на надпись «START DICTATING» в центре;
  3. На рабочей панели справа выберите язык диктовки (к примеру, «Русский»);
  4. Нажмите на надпись «Start» слева и начните вашу диктовку;
  5. Для окончания процесса чтения нажмите на «Stop»;
  6. Для сохранения результата нажмите на кнопку «Download» справа и выберите формат сохраняемого файла (txt или doc).speechtexter.com-nachitka.jpg

Способ №3. Convert.town — простой инструмент для конвертации речи в текст

Сервис convert.town относится к инструментам типа «Включил и работай». Как и другие сервисы данного плана, он работает на «Web Speech API» и требует для своей работы браузер Chrome. Сервис практически не имеет каких-либо настроек.

Для работы с ним достаточно перейти на convert.town, и сразу же начать диктовку голосом нужного вам текста. Полученный результат сразу будет отображаться в соответствующем окне внизу. Останется скопировать его и перенести в нужный вам редактор (например, МС Word).

Способ №4. Онлайн-расширения для браузера Chrome

Также следует упомянуть расширения «Голосовой ввод текста» и «Голосовой набор текста» для браузера Хром. После их установки в веб-навигатор вы можете в любой момент активировать их и надиктовать текст в нужном поле браузера, текстового редактора или другого инструмента вашей ОС.

Для работы с расширением вначале необходимо выбрать язык голосового ввода (обычно доступен в настройках расширения). Затем установите курсор в место, где должен быть ваш текст, нажмите ПКМ, после чего активируйте опцию запуска функционала расширения (например, «Speech pad»). Останется надиктовать нужные предложения и сохранить их (отправить получателю).

Для активации возможностей расширения нажмите ПКМ и выберите опцию запуска функционала расширения

Читайте также: Озвучка текста мужским голосом.

Заключение

В нашем материале мы разобрали ТОП-4 способов, позволяющих выполнить голосовой набор текста в режиме онлайн. Все перечисленные инструменты эффективно распознают человеческую речь, переводят её в предложения и могут существенно сократить затрачиваемое вами время на набор статей и докладов. Особенно рекомендуем сервисы speechpad.ru и speechtexter.com – они заслужили множество хвалебных отзывов от благодарных пользователей.

На сегодняшний день любой персональный компьютер является универсальным инструментом, позволяющим различным пользователям работать и общаться. При этом людям с ограниченными возможностями может быть неудобно использовать базовые средства ввода, отчего возникает необходимость организации ввода текста с помощью микрофона.

Способы голосового ввода текста

Первая и наиболее значимая оговорка, которую необходимо сделать, заключается в том, что ранее мы уже рассматривали тему управления компьютером при помощи специальных голосовых команд. В той же статье нами были затронуты некоторые программы, способные помочь вам в решении поставленной в данной статье задачи.

Для ввода текста путем произношения используется более узконаправленное программное обеспечение.

Читайте также: Голосовое управление компьютером на Windows 7

Прежде чем перейти к рекомендациям в рамках этой статьи вам следует обзавестись достаточно качественным микрофоном. Кроме того, может потребоваться дополнительная настройка или калибровка звукозаписывающего устройства путем выставления специальных параметров через системные инструменты.

Читайте также: Устранение проблем с микрофоном

Только после того, как вы будете уверены в полностью исправной работе вашего микрофона, следует переходить к методам решения задачи голосового ввода текстовых символов.

Способ 1: Онлайн-сервис Speechpad

Первый и наиболее примечательный метод организации голосового ввода текста заключается в использовании специального онлайн-сервиса. Для работы с ним от вас потребуется скачать и установить интернет-обозреватель Google Chrome.

Сайт довольно часто бывает перегружен вследствие чего могут быть проблемы с доступом.

Разобравшись со вступлением, можно переходить к описанию возможностей сервиса.

Перейти к сайту Speechpad

  1. Откройте главную страницу официального сайта голосового блокнота, используя представленную нами ссылку.
  2. При желании вы можете изучить все основные нюансы работы данного онлайн-сервиса.
  3. Пролистайте страницу до основного блока управления функционалом голосового ввода текста.
  4. Вы можете настроить работу сервиса удобным для вас образом, используя блок с настройками.
  5. Рядом со следующим полем нажмите кнопку «Включить запись» для инициализации процесса голосового ввода.
  6. По факту успешного ввода воспользуйтесь кнопкой с подписью «Отключить запись».
  7. Каждая набранная фраза будет автоматически перемещена в общее текстовое поле, позволяющее выполнять некоторого рода операции над содержимым.

Затронутые возможности, как можно заметить, значительно ограничены, но при этом вполне позволят вам набирать большие блоки текста.

Способ 2: Расширение Speechpad

Данная разновидность голосового ввода текста является прямым дополнением к ранее расписанному методу, расширяя функционал онлайн-сервиса буквально на любые другие сайты. В частности, такой подход к реализации голосового написания текста может быть интересен людям, которые по каким-либо причинам не могут использовать клавиатуру при общении в социальных сетях.

Расширение Speechpad стабильно работает исключительно с браузером Google Chrome, равно как и онлайн-сервис.

Переходя непосредственно к сути способа, от вас потребуется выполнить ряд действий, заключающихся в скачивании и последующей настройке нужного расширения.

Перейти к магазину Google Chrome

  1. Откройте главную страницу интернет-магазина Гугл Хром и в поисковую строку вставьте название расширения «Speechpad».
  2. Среди результатов поиска найдите дополнение «Голосовой ввод текста» и кликните на кнопку «Установить».
  3. Подтвердите предоставление дополнительных разрешений.
  4. После успешной установки дополнения на панели задач Гугл Хрома в правом верхнем углу должен появиться новый значок.

Читайте также: Как устанавливать расширения в браузер Google Chrome

Теперь можно заняться рассмотрением основных возможностей данного расширения, начиная с параметров работы.

  1. Кликните по иконке расширения левой кнопкой мыши, чтобы открыть основное меню.
  2. В блоке «Язык ввода» можно выбрать базу данных определенного языка.

Поле «Код языка» выполняет точно такую же роль.

Установите галочку «Продолжительное распознавание», если нужно самостоятельно контролировать процесс завершения ввода текста.</li>О прочих особенностях данного дополнения вы можете узнать на официальном сайте Speeachpad в разделе «Помощь».</li>Завершив выставление настроек, воспользуйтесь клавишей «Save» и перезапустите веб-обозреватель.</li>Чтобы воспользоваться возможностями голосового ввода, кликните правой кнопкой мыши по любому текстовому блоку на веб-странице и через контекстное меню выберите пункт «SpeechPad».</li>По необходимости подтвердите разрешение использования микрофона браузером.</li>В случае успешной активации возможности голосового ввода текстовая графа будет окрашена в специальный цвет.</li>Не снимая фокуса с текстового поля, произнесите текст, который необходимо ввести.</li>При активированной возможности продолжительного распознавания вам потребуется повторно кликнуть по пункту «SpeechPad» в контекстном меню ПКМ.</li>Работать данное расширение будет практически на любом сайте, включая поля ввода сообщений в различных социальных сетях.</li></ol>

Рассмотренное дополнение, по сути, является единственным универсальным способом голосового ввода текста буквально на любом веб-ресурсе.

Описанные возможности – это весь функционал расширения Speechpad для браузера Google Chrome, доступный на сегодняшний день.

Способ 3: Онлайн-сервис Web Speech API

Данный ресурс не сильно отличается от ранее рассмотренного сервиса и выделяется крайне упрощенным интерфейсом. При этом заметьте, что функционал Web Speech API является основой такого явления, как голосовой поиск от Google с учетом всех побочных нюансов.

Перейти к сайту Web Speech API

  1. Откройте главную страницу рассматриваемого онлайн-сервиса, используя представленную ссылку.
  2. Внизу открывшейся страницы укажите предпочтительный язык ввода.
  3. Кликните по значку с изображением микрофона в правом верхнем углу основного текстового блока.

В некоторых случаях может потребоваться подтверждение разрешения использования микрофона.

Произнесите нужный текст.</li>После завершения процесса написания вы можете выделить и скопировать подготовленный текст.</li></ol>

На этом все возможности данного веб-ресурса заканчиваются.

Способ 4: Программа MSpeech

Затрагивая тему голосового ввода текста на компьютере, попросту нельзя игнорировать программы специального назначения, одной из которых является MSpeech. Основная особенность данного софта заключается в том, что распространяется этот голосовой блокнот по бесплатной лицензии, но не ставит особо значимых ограничений перед пользователем.

Перейти к сайту MSpeech

  1. Откройте страницу скачивания программы MSpeech, воспользовавшись представленной выше ссылкой, и кликните по кнопке «Скачать».
  2. Загрузив софт к себе на компьютер, выполните базовый процесс инсталляции.
  3. Запустите программу путем использования иконки на рабочей столе.
  4. Теперь на панели задач Windows появится иконка MSpeech, по которой необходимо кликнуть правой кнопкой мыши.
  5. Откройте основное окно захвата, выбрав пункт «Показать».
  6. Для старта голосового ввода воспользуйтесь клавишей «Начать запись».
  7. Чтобы закончить ввод используйте противоположную кнопку «Остановить запись».
  8. По мере необходимости вы можете воспользоваться настройками данной программы.

Данный софт не должен вызвать у вас проблем в процессе эксплуатации, так как все возможности детально описаны на указанном в начале метода сайте.

Расписанные в статье способы являются наиболее популярными и удобными решениями задачи голосового ввода текста.

Читайте также: Как поставить голосовой поиск Гугл на компьютерМы рады, что смогли помочь Вам в решении проблемы.Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Помогла ли вам эта статья?

Быстрый набор текста нужен очень многим. Это и авторы Яндекс Дзен. И копирайтеры. И специалисты о социальным сетям. И владельцы сайтов. И…. много кому еще. Но не всегда можно быстро научиться например, десятипальцевому  методу слепой печати. Что же делать? Конечно же, пользоваться сервисами голосового набора текста онлайн и на компьютере. В этой статье я предоставлю обзор основных сайтов и программ, которыми часто пользуюсь и сам.

Вообще, когда я узнал про голосовой набор текста, я сначала не поверил своему счастью. Ведь несмотря на то, что скорость набора текста у меня высокая, все равно, ее не сравнить со скоростью проговаривания текста. И я решил проверить на себе все плюсы и минусы таких “говорильных” сервисов. Надеюсь после прочтения этой статьи Вы сами решите, каким сервисом Вам лучше пользоваться.

Кстати, эту статью я набрал с помощью одного из сервисов голосового набора 🙂

Содержание:

Что такое голосовой набор текста?

Мы привыкли к тому, что если нужно что-то напечатать на компьютере, то без клавиатуры не обойтись. А если нужно напечатать быстро? Тогда можно просто этому научиться. Сейчас есть масса платных и бесплатных тренажеров слепой быстрой печати. Да и курсы всякие имеются на эту тему. Было бы желание и время… И время… Если с желанием обычно нормально, то со временем часто не очень. Нужно около месяца на реальное убыстрение печати. А времени обычно нет. Как всегда, нужно уметь быстро печатать “всегда”. И еще.. Для быстрой печати очень часто нужно покупать специальную клавиатуру. Далеко не каждая “штатная” подходит для этого дела. Ну это так, к слову.

Ладно. Если учиться быстро печатать долго, то нет ли других технических способов убыстрить этот процесс? Ведь на дворе XXI век! Конечно же есть. Если Вы умеете быстро писать обычной ручкой, то есть смысл рассмотреть покупку “умной” ручки. Что это такое? Это ручка с умной электронной начинкой. Вы можете писать или на специальном блокноте, или даже на обычной бумаге, а умная ручка сразу же запоминает Ваши каракули к себе в память. И переводит их в электронный текст. И потом можно выгрузить готовую статью в любой текстовый редактор. Немного “подрихтовать” ее… И готово! Кстати, стоят такие “чудо-девайсы” не очень дорого. В районе 10 000 – 15 000 рублей (на момент написания данной статьи).

Если же Вы не любите быстро писать, или не умеете, то остается только один путь. Завести секретаршу.  Голосовой набор текста . Онлайн или оффлайн.

Что такое голосовой набор текста? Вкратце это выглядит так. Вы просто говорите текст в микрофон. При этом не забыв запустить специальную программу, открыв сайт или приложение на смартфоне. Ваши слова тут же отображаются в виде текста в окне программы. Потом можно отредактировать этот текст и сразу же копировать в текстовые редакторы. Кстати, в некоторых сервисах можно не только говорить самому, а подключить например Ютуб. Или загрузить аудиофайл. И сервис перевода голоса в текст тоже все прочитает и расшифрует.

Кстати, по научному перевод голоса в текст называется транскрибацией.

Кому он пригодится?

Собственно говоря, голосовой набор текста может пригодиться много кому. Вот например:

  • Копирайтерам и рерайтерам.
  • Авторам Яндекс Дзен
  • Фрилансерам, которые занимаются транскрибацией текста
  • Журналистам
  • Студентам
  • Писателям
  • Людям с ограниченными возможностями
  • Авторам блогов
  • Руководителям, для записи умных мыслей 🙂
  • Секретаршам для записи умных мыслей руководителей 🙂

Я перечислил только несколько из множества возможных примеров использования. То есть эти сервисы и программы пригодятся всем, кому нужно много печатать, но кто не успел освоить (или поленился) методы быстрой печати.

То есть, сервисы набора текста с помощью голоса или по другому сервисы транскрибации нужны в первую очередь всем тем, кому нужно много печатать, но не всегда есть возможность или желание это делать 🙂

Кстати, есть еще один не очевидный плюс использования таких сервисов. Если автор не очень грамотен, то использование голосового набора частично решит эту проблему. Во всяком случае, слова буду написаны верно. Это не относится к знакам препинания. Тут автору нужно выкручиваться самому 🙂

Виды программ и сайтов набора текста голосом.

В целом можно выделить следующие виды сервисов голосового набора текста онлайн:

  • Сайт. То есть онлайн в интернете
  • Приложение для смартфона
  • Программа для скачивания на компьютер

С онлайн сервисами все понятно. Это обычно сайт, который открывается в интернете и Вы начинаете начитывать туда текст. А это сервис транскрибирует, то есть переводит голос в текст.

Разновидностью онлайн приложений являются приложения для браузеров. В частности для Гугл Хром. Они устанавливаются на соответствующий браузер и соответственно работают только в нем.

Есть еще отдельно приложения для смартфонов. Причем есть как для Андроида, так и для iOs, то есть для Айфона.

Ну и можно при желании найти и программы для голосового набора для компьютера. Установить их на стационарный ПК или ноутбук и пользоваться даже если нет интернета. Это плюс таких программ.

Краткий обзор основных сервисов транскрибации

Итак. Давайте вкратце рассмотрим эти программы.

а. Speechpad

Голосовой ввод текста или голосовой блокнот. Это ссылка на приложение Гугл Хром speechpad

Кстати, можно просто перейти и на указанный сайт и переводить прямо на сайте. Ну например, если Вы пользуетесь не Гугл хромом, а каким-то другим браузером. Я кстати, именно с помощью этого сервиса и набрал эту статью. На данный момент этот сервис полностью бесплатный

Из дополнительных “плюшек” этого сервиса голосового набора текста онлайн:

  • Интеграция с Windows или  Linux. После этого можно вводить текст голосом в нужную форму или поле приложений этих операционных систем. Правда  как это делается “вживую”, я  еще не “разведал”.
  • Возможность транскрибации прямо с Ютуба или аудиоролика. То есть можно загрузить ролик или указать путь к видеоролику и адью… Ролик я смог загрузить и все заработало. А вот с Ютубом что-то пока не разобрался. Да в принципе это мне не очень и нужно. На ютубе можно напрямую субтитры скачать.
  • Еще можно прямо во время голосового набора делать правки и расставлять знаки препинания. Очень удобно!
  • Есть еще функция синхронного перевода. То есть читаешь текст на одном языке, а печатает уже на другом. Но я эту функцию тоже еще не потестировал. Попробуйте, если интересно!

Короче, это сервис мне очень понравился! Функционал просто шикарный! И кстати, этот сервис лучше всего распознал мой голос и сделал меньше всего ошибок! Так что моя оценка – 10 из 10 !!!!

б. Войснот II

Есть приложение для Гугл хром и есть отдельный сайт. https://voicenote.in/live/. Тоже бесплатное приложение.

Ничего сложного. Выбираете язык и начинаете запись. Есть решим редактирования. Можно делать заметки. Можно сохранять текст. В целом неплохо, но конечно функционал очень простой. Ну и немножко худе распознало текст.  Оценка 8 из 10.

в. Voice Notepad

Это сайт. Вот ссылка на него. https://dictation.io/speech. Тоже бесплатный сервис.

Мне этот сервис голосового набора понравился немного больше, чем предыдущий. Как-то он лаконичнее, что ли. Приятнее для глаза. Хотя распознавание слов примерно такое -же. Только за дизайн ставлю оценку немного повыше. 9 из 10.

Этими сервисами голосового набора я и пользуюсь в основном. В особенности первым. Но чтобы у Вас было более полное представление обо всех возможных вариантах, я ниже дам ссылки на еще некоторые сайты или программы. Кстати, недавно я начал еще активно и голосовым вводом Гугл документов пользоваться, об этом тоже скажу ниже подробнее..

г. August4u

Еще один бесплатный блокнот для голосового набора. Вот ссылка https://august4u.net/?speech2text

Ничего лишнего. Просто набор текста с помощью голоса. И все 🙂

д.Talktyper

Бесплатный сайт. Выбираете язык. Настраиваете подключение микрофона и вперед.. Вот ссылка. https://talktyper.com/ru/index.html

Здесь Вам предложат разные варианты распознавания, что очень удобно, если у Вас не идеальные условия для записи. Есть редактор. Есть сохранение в разные форматы. Простенько но удобно.

е. Голосовой ввод Гугл Документы

Старые добрые Гугл Документы. Естественно бесплатно. Ссылку не даю, и так найдете сами 🙂

Для того, чтобы начать пользоваться голосовым набором, нужно зайти на панели в “инструменты” и нажать там “голосовой ввод”. Кстати, можно голосом вставлять знаки препинания! То есть говорить “точка”, “запятая” и т.п. И они вставляются! Очень круто и полезно! Сейчас я голосовым вводом Google Doc пользуюсь тоже постоянно именно из-за этой фичи. Поэтому оценка 10 из 10!

Ж. Голосовой ввод текста в Ворд

Если Вы пользуетесь Майкрософт Офисом и в частности Вордом, то знайте. И там есть возможность голосового ввода. Но для этого нужно скачать и установить стороннее приложение Dictate.

К сожалению, я не смог протестировать данное приложение, так как у меня на компьютере стоит Линукс Минт. И соответственно, я пользуюсь Либро Офисом. Так что если надумаете тестировать этот dictate – то это на Ваше усмотрение и на Ваш риск!

З. Программа MSpeech

С сайтами закончили. Возможно есть и еще какие-либо хорошие онлайн-сервисы по голосовому вводу текста. Можете мне скинуть ссылку и я про них расскажу. А пока даю ссылку на бесплатную программу, которую нужно скачивать себе на компьютер. Вот она https://programs74.ru/mspeech.html

Функционал у нее достаточно обширный. Из интересных это возможность выбора источника звука, назначение горячих клавиш для быстрого редактирования, предредактирование текста перед окончательным вводом в окно текста и т.п. Короче, много чего нужного.

К сожалению, она работает только под Виндовс. А у меня, как я уже писал выше, стоит Линукс. Поэтому протестировать программу тоже не удалось.

Еще есть и платные программы для голосового ввода. Если будет желание, я про них тоже расскажу. Но мне пока за глаза хватает функционала бесплатных. Поэтому я в этом обзоре и не стал рассказывать про платные “вводчики текста”.

И. Голосовой набор текста на Андроид

Этих голосовых приложений для Андроида оказалось очень много!!! Около 10 штук точно! Поэтому я сейчас просто приведу тут список. Но без всяких комментариев, так как ничего из этого я не протестировал.

  • Google Keyboard
  • List Note Speech-to-Text Notes
  • Speech To Text Notepad
  • Speech To Text
  • Voice Text
  • Voice To Text
  • Voice To Text for Multi-Apps
  • Text by Voice
  • Speech to Text
  • Evernote
  • Lyra Virtual Assistant
  • Voice Notes

К. Голосовой набор текста в Айфоне

А вот тут я Вам пока ничего не посоветую. У меня нет Айфона 🙁 . Или 🙂 … А рассказывать с чужих слов не очень хорошо. Давайте договоримся так. Вы мне скидываетесь и покупаете новый Айфон 🙂 Вы мне пришлете свои варианты голосового набора в Айфоне и я потом про это расскажу в отдельной статье. Хорошо? Ну и ладно… Договорились!

Недостатки таких сервисов.

При всех плюсах сервисов голосового набора текста есть и минусы. Давайте о них поговорим поподробнее,

  • Далеко не всегда все слова распознаются правильно. Особенно если дикция у человека “хромает” или в комнате достаточно шумно. Или микрофон не очень качественный. Или этот микрофон располагается на большом удалении от рта. Эти слова нужно выявить и поправить. Это достаточно трудоемко.
  • Текст потом нужно редактировать. Причины я писал выше. Но факт, что расстановка знаков препинания и разбивка тексты на логические абзацы тоже достаточно трудоемкая вещь. А еще нужно выделять ошибки, которые вкрались в текст. Вот пример. Прочитайте с первого раза: “С кем снять двушку”? Если Вы мужчина, то скорее всего прочитали не то, что написано 🙂 . Мозг нас постоянно обманывает при вычитке текста, а подобные ошибки не распознает ни одна “грамматическая” система!
  • Желательно все слова произносить четко и громко. И не быстро и не медленно. Оптимально. Это не все могут. А в некоторых случаях и невозможно из-за какой-либо ситуации. Например, Вы едете в общественной транспорте и не можете громко надиктовывать текст.
  • Если записывается о чем говорят несколько человек одновременно (например на собрании), то вообще получается такая куча из слов, что вычленить кто что говорил очень сложно!
  • Невозможно (или очень сложно) поправить текст предложения во время начитки. А ведь иногда хорошие мысли приходят прямо во время печатания и если при печати можно просто перебить текст заново, то при начитывании нужно или второй раз надиктовывать второй вариант предложения. Или останавливаться и править написанное.

Но в общем и целом, обычно такие минусы не очень мешают голосовому набору текста. В общем-то обычно ситуация для начитки достаточно близка к идеальной и ошибок не очень много. Поэтому если Вам понравилось так набирать текст, то это действительно очень хорошо, так как Вы будете экономить кучу времени.

Теперь Вы знаете про основные сайты и программы для голосового набора текста онлайн. Надеюсь эти сервисы помогут Вам быстрее набирать свои заметки или статьи и зарабатывать еще больше денег :).

Ваш Nаставник онлайN

B

Содержание:

SpeechToText_2.pngГолосовой ввод – способ ввода текста при помощи обычной речи, передаваемой посредством микрофона. Иногда голосовой ввод ассоциируется с голосовым управлением компьютером, однако, последнее является более простой задачей и не подразумевает полноценного преобразования голоса в текст.

Наиболее развиты функции голосового набора в мобильных операционных системах Android и iOS, но, при необходимости, их можно реализовать и в Windows. Кстати, в последней версии Windows 10 Microsoft планирует доработать русскоязычный голосовой ввод до уровня встроенного в систему модуля (англоязычный модуль уже работает), однако, обладателям более старых версий всё-таки придётся пользоваться сторонними решениями.

Если Вам хочется попробовать превратить свой компьютер в виртуального стенографиста, попробуйте один из предложенных в статье ниже способов или форму ниже:

Форма для распознавания голоса в текст онлайн

Нажмите на иконку микрофона и начните говорить.

Говорите!

Не было записано никаких звуков. Возможно, Вам нужно настроить микрофон.

Микрофон не подключён. Убедитесь, что Вы подключили его к нужному разъёму и проверьте правильность настроек микрофона.

Чтобы активировать микрофон, нажмите кнопку “Разрешить” вверху.

Не было дано разрешения на работу микрофона.

Использование микрофона заблокировано. Чтобы исправить это, перейдите в настройки браузера по адресу: chrome://settings/contentExceptions#media-stream

Web Speech API не поддерживается Вашим браузером. Установите браузер Chrome версии 25 и выше.

Нажмите CTRL+C чтобы скопировать текст.

(Command+C на Mac OS.)

Текст отправлен в почтовую программу по умолчанию.

(См.: chrome://settings/handlers для изменений.)

SpeechToText_new.png
Язык: Русский
Формат: HTML
Обновлено: 2016-03-12
Автор: BestFREE.ru

ad S2 / –> SpeechToText_ico.png

Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.

Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше :)) несовершенство… На ней ещё нужно уметь быстро печатать!

Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня 🙂

Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде “Горыныча” и “Диктографа”. Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево…

Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.

Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:

SpeechToText_1.png

Как видим, преобразование речи в текст происходит в несколько этапов:

  1. Оцифровка голоса. На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой карты.
  2. Сравнение записи с записями в словаре. Здесь работает принцип “чем больше – тем лучше”: чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
  3. Вывод текста. Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.

Со второй проблемой, увы, не всё так просто… Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!

В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.

Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API. Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях…

Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными… Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!

Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech:

SpeechToText_3.png

Основное окно программы имеет максимально простой интерфейс – индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:

SpeechToText_4_small.png

Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек “Команды”, которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.

Вообще же MSpeech – довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании – компьютер должен быть подключён к Интернету для доступа к словарям Гугла.

Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.

Ну и, естественно, первым делом стоит упомянуть о “родном” сервисе Google под названием Web Speech API:

SpeechToText_small.png

Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.

Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис “понимает” ещё и знаки препинания: если Вы скажете “точка” или “запятая”, необходимый знак появится в форме вывода.

По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.

Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.

Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье 😉

На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io:

SpeechToText_5_small.png

В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку “Clear”.

Как и сервис Google Dictation.io “умеет” ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.

Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет TalkTyper:

Главные преимущества сервиса:

  • наличие русскоязычного интерфейса;
  • возможность просмотра и выбора вариантов распознавания;
  • наличие голосовых подсказок;
  • автоотключение записи после длительной паузы;
  • встроенный текстовый редактор с функциями копирования текста в буфер обмена, распечатки его на принтере, отправки по почте или в Твиттер и перевода на другие языки.

Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.

Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.

Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.

Одним из лучших расширений для перевода речи в текст является SpeechPad:

Не совру, если скажу, что SpeechPad – один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:

  • поддержка голосовых команд управления компьютером;
  • улучшенная поддержка расстановки знаков препинания;
  • функция отключения звуков на ПК;
  • интеграция с Windows (правда, на платной основе);
  • возможность распознавания текста с видео или аудиозаписи (функция “Транскрибация”);
  • перевод распознанного текста на любой язык;
  • сохранение текста в текстовый файл, доступный для скачивания.

Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт “SpeechPad”. Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.

После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:

Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное Oweb Voice Input. Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана…

Если же Вы являетесь любителем социальной сети VK.com, то можете установить расширение Голосовой ввод для ВКонтакте:

После установки данного плагина ко всем полям ввода ВКонтакте добавляется иконка микрофона, нажатие на которую активирует запись звука с последующим распознаванием сказанного Вами в текст. Работает плагин хорошо, но, увы, только ВКонтакте…

Несмотря на то, что до сих пор не существует способа, который бы обеспечил стопроцентное распознавание голоса в текст, за последние годы прогресс всё же наметился. Как мы могли убедиться, этому активно способствует корпорация Google. Создав свой Web Speech API, Гугл, практически открыл дорогу всем желающим для создания программ и сервисов перевода речи в текст. Причём, все они потенциально бесплатны!

Если Гугл не забросит развитие словарей распознавания голоса (как это у него, увы, часто бывало с другими проектами), то уже в ближайшем будущем у нас будет шанс получить качественные и бесплатные инструменты голосового ввода. Думаю, что так оно и будет, поскольку даже наш Яндекс ведёт активную работу в данном направлении. А, если будет конкуренция, то будет и развитие…

На сегодняшний же день мы уже можем использовать некоторые наработки, которые дают нам возможность распознавать речь с точностью от 60 до 90% (зависит от Вашей дикции и качества микрофона). В принципе, такой точности достаточно для надиктовки чернового варианта любого текста с последующей его правкой. Поэтому, если Вы до сих пор медленно печатаете, попробуйте голосовой ввод. Вполне возможно, что Вы будете очень довольны 😉

P.S. Разрешается свободно копировать и цитировать данную статью при условии указания открытой активной ссылки на источник и сохранения авторства Руслана Тертышного.

–> –> ad S5 / –>

Получать обновления:

–>

CommentIt Ajax. Error: Access denied for user ‘srv33547_ru1000’@’localhost’ (using password: YES)CommentIt Ajax. Error:Access denied for user ”@’localhost’ (using password: NO)

Используемые источники:

  • https://speechpad.ru/
  • https://sdelaicomp.ru/obzori/golosovoj-vvod-teksta-onlajn.html
  • https://lumpics.ru/how-to-make-voice-input-on-a-pc/
  • https://avbessonov.ru/golosovoj-nabor-teksta-onlajn-na-kompyutere-top-sajtov/
  • https://www.bestfree.ru/article/computer/speech-to-text.php

Оцените статью
Рейтинг автора
5
Материал подготовил
Илья Коршунов
Наш эксперт
Написано статей
134
7th-studio.ru
Добавить комментарий