Голосовой блокнот — программа для набора текста голосом

Что такое транскрибация

Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.

Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.

Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.

Перевод речи в текст вручную или с помощью специальной программы полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

О проблемах автоматического перевода речи в текст

Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

Речь у всех людей разная:

  • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
  • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
  • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.

В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.

Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

Нюансы по использованию набора текста при помощи Google

Если данная функция используется впервые, браузер может спросить разрешение для подключения микрофона.

Если хотите аудио дорожку просто набрать текстом, используйте разные устройства, в одном браузере микрофон Google не будет писать, он сразу выключается.

Микрофон выключается, если вы переключитесь в соседнюю вкладку.

Если нужно в тексте поставить точку, то говорите это голосом, он сообразит, что это знак препинания.

Увеличивайте свою производительность, используя такие полезные сервисы!

Какие еще есть интересные и полезные опции есть у Google, читайте у меня на блоге —
.

Я благодарю Елену за обзор такого полезного сервиса. Сама первый раз узнала, что у Гугла есть такая опция.

Спасибо! Этот ролик для тебя, Елена!

Кому сложно набирать текст, а также говорунам — в самый раз. Я попробовала — работает!

Не знаю, пригодится вам такая фишка, «речевой ввод текста»
, но на сегодняшний день – это очередной прорыв в технологиях. Ещё год назад я искал такую и нашел какие-то сырые программы, которые на русском языке ни «бэ ни мэ».

Сегодня реализован в браузере Хром, в переводчике Google. Правда, пока что только на английском языке. А вот на сайте http://www.russconnect.ru/?do=golos – эта фишка работает уже на русском языке полным ходом. Странно…

Итак, как печатать «голосом»?

На это «чудо» стоит посмотреть. Сначала взглянем на интерфейс сервиса, разберемся, как он работает, а потом, как и где эту технологию можно применять.

Если вы зайдете на указанный выше сайт
вы сразу увидите предупреждение, что голосовой ввод текста работает только с Хромом, и чуть ниже – вот такой интерфейс:

Самая главная кнопка здесь – это значок микрофона в правом верхнем углу. Ставите курсор в самое верхнее (узкое) горизонтально поле, нажимаете на этот значок и вещаете в свой микрофон, который заблаговременно нужно включить.

Произносите слова членораздельно. Сказали фразу, тут же в том поле, где стоит курсор появится напечатанный текст!! По щучьему велению, да по вашему хотению, как в сказке.

Жмете «Добавить», и текст с поля ввода впрыгнет в широкое поле онлайн редактора. Затем произносите ещё одну фразу и снова жмете «Добавить» – новый текст добавляется к уже существующему.

Одним словом, так можно «записать» все, что на ум взбредет. Хоть статью сочинить, хоть поэму написать. А потом подредактировать все это дело.

Недостатки голосового ввода текста.
По-видимому в базе программы ещё нет всех слов, иногда бывает, подставляет похожее по звучанию, не то, что было произнесено. Не очень дружит она с окончаниями слов. И не ставит точек в конце предложения. Но в общем, на удивление, работает прилично.

Где и как можно этот сервис использовать?

Здесь уже, как вам ваша фантазия подскажет.

Мне лично печатать традиционным способом получается быстрее, если я пишу статью. А вот если бы пришлось набирать небольшой текст с книги, вот тут, пожалуй, печать голосом была бы в самый раз.

Другой вариант – у вас полет мысли и вы тут же её визуализируете, превращаете в буковки. Для транскрибации
вряд ли подойдет.

Скажу честно, непривычно. Думаю, что самый лучший вариант её использовать – это включить и говорить, как бы без пауз, чтобы программа записывали длинные куски текста. Дело в том, что она реагирует на люфт паузы и запись останавливается. Тогда нужно делать ввод текста и возобновлять речь. Но думаю, эти неудобства временны. Куда катится мир…

Лицензия (Ограничения использования)

«Laitis», все его составляющие и отдельные компоненты (в том числе, но не ограничиваясь: коды, лежащие в их основе, алгоритмы, элементы дизайна, шрифты, логотипы, а также текстовые, графические и иные материалы) являются объектами интеллектуальной собственности, которые охраняются в соответствии с нормами национального и международного законодательства, любое использование которых допускается только на условиях данного Соглашения.

Права и способы использования «Laitis» в явном виде не предоставленные/не разрешенные Пользователю по настоящему Соглашению, считаются не предоставленными/ запрещенными Правообладателем.

Запрещается менять наименование «Laitis», изменять и/или удалять обозначение авторских прав (copyright).

Не допускается использование Пользователем каких-либо программных средств, компонентов, функций, скриптов, модулей и т.д., которые могут изменить алгоритм работы «Laitis».

Запрещается дешифровать, эмулировать, изменять, декомпилировать, дизассемблировать исходный код «Laitis» и его компонентов с целью несанкционированного использования и/или получения информации о реализации используемых в них алгоритмов.

Запрещается вскрывать и использовать технологии и исходные коды «Laitis» для создания других программных продуктов и сервисов, или для создания новых версий «Laitis».

Незаконное использование указанных в данном Соглашении объектов интеллектуальной собственности влечет гражданскую, административную и уголовную ответственность.

Пользователь возмещает любые доказанные убытки, включая упущенную выгоду, возникшие у Правообладателя, в связи с нарушением им условий данной Лицензии.

Пользователь соглашается с тем, что финансовая ответственность, в части возмещения убытков и/или упущенной выгоды, возникшие у Правообладателя, в связи с нарушением им условий данного Соглашения, не ограничивается сроками использования «Laitis». Пользователь гарантирует, что независимо от того, использует он «Laitis» или нет, в случае нарушения условий данной Лицензии, обязуется возместить причинённые убытки и компенсировать упущенную выгоду Правообладателя.

Вся ответственность за несоблюдение условий данного Соглашения распространяется в том числе и на владельца сайта и/или Интернет-ресурса, где был использован «Laitis» и были выявлены нарушения условий при его использовании.

Полезные программы для голосового набора текста на компьютере с поддержкой русского языка.


Горынычем лучше других программ русским голосом
управлять компьютером,
а голосовой набор текста рекомендуется производить в онлайн-приложении
Google Web Speech. Оно доступно только для браузеров Chrome. Web Speech
поддерживает 32 языка (среди них даже японские и китайские иероглифы).
Для того чтобы напечатать текст с помощью колоса нужен только интернет,
браузер Chrome и микрофон. Русский язык программа прекрасно понимает и
выдает результат целыми словами переводя устную речь в печатный текст.
Сейчас уже закончились разработки платного приложения для аудио и даже
видео распознании речи компьютером. Программа RealSpeaker способна
распознать не только голос, но и мимику пользователя. Для ее
использования подойдет обычная веб-камера с помощью, которой программа
будет «читать по губам» пользователя компьютера. Такой подход повышает
эффективность во голосовом управлении с помощью преобразования не
только речи, но и мимики в текстовые команды. RealSpeaker уже сегодня
имеет поддержку русского и еще 10 популярных языков. Программа
рассчитана для платформ Windows7 / 8. После инсталляции программу
следует настроить. Голову нужно держать ровно, нежелательно допускать
частых потерь контакта лица с веб-камерой. Расстояние от веб-камеры
желательно не превышать 40-ка см. Присутствует словарь с русским
языком, который можно расширить. Но в целом, по сравнению с Горынычем,
RealSpeaker более удобен для преобразования голоса в текст.

Программы и приложения для набора текста голосом:

Голосовой ввод текста на компьютере;

Системы распознавания человеческого голоса оцифровывают произнесенные слова, поступающие с микрофона, и идентифицируют, обращаясь к словарям.

Лучшие программы для голосового набора текста

  • MSpeech: для распознавания использует Google Voice API, поддерживает 50 языков и большое количество функций по форматированию и редактированию текста.
  • Voco отличается большим словарным запасом, функцией рапознавания аудиозаписей, расставление знаков препинания по команде. Но есть один минус: она платная.
  • Dictate – приложение для Microsoft Office отличается большим количеством поддерживаемых языков.
  • SpeechPad уникален, так как работает с аудио и видео, может быть использован для набора голосом в различных приложениях.

Голосовой набор текста на Андроид (стандартные функции и приложения);

На платформе Android голосовое управление предоставляет широкие возможности:

  • Управление приложениями.
  • Набор текста в запросах, заметках, документах, смс и сообщениях в соцсетях.
  • Разговорную и игровую функцию.
  • Перейдите в раздел «Настройки».
  • Выберите подраздел «Язык и клавиатура».
  • Затем активируйте пунк меню «Клавиатура Android».
  • Найдите и выберите «Голосовой ввод».
  • При активации клавиатуры на ней есть кнопка с изображением микрофона – кликните на нее и запустится голосовой ввод.
  • Знаки препинания необходимо проговаривать словами.
  • Можно задать команду запуска, как например, у Гугл: «Окей, Гугл».

Голосовой набор текста на iPhone.

  1. Функция «Диктовка»:
  • Распознает речь.
  • Автоматически расставляет знаки пунктуации.
  • Работает только с включенной опцией интернета.

Для активации необходимо:

  1. Открыть «Настройки».
  2. Выбрать подраздел «Основные».
  3. Перейти в подменю «Клавиатура».
  4. И выбрать пункт «Включить диктовку».

По окончании активации в блоке ввода появится микрофон.

  1. Приложение Siri:
  • Распознает и записывает речь.
  • Сохраняет в заметках.
  • Активировать Сири.
  • Произнести вслух: «Создать новую заметку».
  • Диктовать.

При произнесении фиксировать пунктуацию и разделение смысловых частей можно путем озвучивания знаков препинания.

Как повысить качество речевого ввода текста на компьютере

Любой сервис или программа для обработки речи, преобразования её в текстовый вид будет работать лучше, если обеспечить для этого все условия, ведь качество написания напрямую зависит от правильно настроенного микрофона, дикции пользователя, отсутствия дополнительного шумового сопровождения. Не стоит надеяться, что распознаватель голоса будет корректно работать, если имеются явные речевые дефекты. Чтобы снизить количество ошибок и меньше посвящать времени корректировке текста, нужно соблюдать следующие условия:

  • Для корректного преобразования речи необходимо чистое произношение и отсутствие посторонних звуков. Если максимально чётко выговаривать слова с расстановкой знаков препинания, править текст не придётся слишком долго;
  • Перед выполнением работ необходимо настроить микрофон. Если нет возможности ликвидировать посторонние шумы, лучше снизить его чувствительность и произносить слова громче и внятнее;
  • Не нужно произносить слишком длинные фразы, приправленные множеством сложных синтаксических конструкций.

Если следовать этим рекомендациям и приловчиться диктовать правильно, программа будет писать текст с минимальным содержанием ошибок, что благоприятно скажется на вашей производительности труда. При этом рассматривать речевой ввод как стопроцентную альтернативу клавиатурному набору пока не приходится, корректировка потребуется однозначно, но многим пользователям такая возможность облегчает повседневные задачи.

Сервисы голосового набора

Существуют сервисы, которые работают онлайн, и есть программы, которые устанавливаются на компьютер.

Онлайн-сервисы

Speechpad

Это бесплатная разработка Google Chrome, которая, соответственно, работает только в этом браузере. Думаю, с этим проблем не будет, ведь это лучший браузер, и если вы до сих пор им не пользуетесь, то читайте статью про то, почему мы выбираем Chrome. Блокнот можно установить прямо в браузер или пользоваться возможностью набора текста голосом, перейдя на их сайт.

Войснот II

Аналогичен предыдущему сервису, также работает только в Google Chrome. Пользоваться им элементарно: выбираем нужный язык и приложение под диктовку само печатает.

August4u

Ещё один интернет-сервис быстрого голосового ввода текста. Понятный интерфейс и бесплатное использование. В арсенале этого сервиса русский, украинский, английский, немецкий, французский и итальянский языки.

TalkTyper

Преимущества данного бесплатного сервиса в наличии голосовых подсказок, возможности просмотра вариантов распознавания. Также имеется удобный редактор, с помощью которого вы cможете скопировать полученный материал, распечатать его на принтере, осуществить перевод на иностранные языки или отправить по почте.

Google Документы

Чтобы воспользоваться набором, не прикасаясь к клавиатуре, вам нужно открыть вкладку “Инструменты”, а затем нажать на “Голосовой ввод…”

Разные команды для редактирования и форматирования пока доступны только на английском языке, но для русского языка поддерживаются пунктуационные команды:

  • “точка”,
  • “запятая”,
  • “восклицательный знак”,
  • “вопросительный знак”,
  • “новая строка”,
  • “новый абзац”.

Как показала практика, это очень удобно.

Программы

Voco

Платная программа, которая при помощи голоса не только печатает на компьютере и устанавливает знаки препинания, но и радует дополнительными опциями: она умеет транскрибировать аудио, также можно расширить версию словарями (например, с юридическими терминами или другими).

Поддерживается операционными системами, начиная с Windows 7 и выше.

Цена: от 1 690 руб.

MSpeech

Бесплатна и может удовлетворить амбиции многих пользователей. Её привлекательность состоит в том, что она может распознавать голос на 50 языках. Для удобного использования есть горячие клавиши, можно самому выбирать источник звука, корректировать распознанный текст.

Голосовой набор при помощи специальных программ

Онлайн сервисы стали действительно удобным и полезным инструментом для предпочитающих голосовой ввод текста людей, но они имеют свои недостатки. Во-первых, многие сайты с таким функционалом нередко испытывают проблемы с совместимостью, если пользователь предпочитает сидеть на каком-нибудь не слишком популярном браузере. Так что лучшей рекомендацией будет переход на Google Chrome – с этим ПО, несмотря на его прожорливость в плане потребления системных ресурсов, совместимо практически все, что только можно.

Во-вторых, многим пользователям приходится работать с большими по объему текстами, обрабатывать по сотне страниц текстового контента. А что если в процессе удаленной работы возникнет критическая ошибка, компьютер перезагрузится, браузер удалит временные файлы, в т.ч. и cookies, а сохраненный текст пропадет? Очень обидно будет начинать все сначала. Именно поэтому людям, настроенным на серьезную работу по переводу звука в текст, следует рассмотреть автономный софт:

1. RealSpeaker – лучшая программа для перевода звука в текст

Качественное приложение, работающее с операционными системами Windows, Mac, Android и Linux, которое поддерживает распознавание тринадцати языков, включая английский и русский (в будущем ассортимент доступных наречий создатели обещают расширять). Функций предостаточно – например, можно не только самому начитывать текст в микрофон, но и считывать его с ранее записанных аудио/видеофайлов, только вот за предоставляемые возможности придется платить.

Онлайн версия сервиса считает по тарифу 8 рублей за минуту. Бесплатными являются только первых 1.5 минуты, которых большинству будет просто недостаточно. Отдельное же приложение требует оплаты лицензии, но народные умельцы уже подсуетились и взломали программку, выложив в свободный доступ на торренты.

2. Speechnotes – приложение голосового набора текста для смартфона

Это узкоспециализированное приложение, целиком и полностью ориентированное на пользователей смартфонов и планшетов под управлением системы Android. Как бы ни эволюционировали виртуальные клавиатуры портативных устройств, из-за их малого размера и отсутствия возможности прочувствовать нажатие клавиши, пользоваться ими по-прежнему менее удобно, чем компьютерными мембранными и механическими вариантами. Отсюда такая популярность Speechnotes и других подобных программ для перевода звука в текст на андроиде.

Вот лишь самые основные:

  • Возможность начитывать голосом не только слова, но и знаки препинания между ними, что сокращает время на редактирование;
  • Совместимость с Bluetooth-гарнитурами – можно хоть на пробежке свои мысли записывать, хоть за рулем автомобиля, хоть зарабатывая в интернете, качество всегда будет на высоте;
  • Ряд настраиваемых клавиш, которым присваиваются самые разные значения. К примеру, вы один раз введете какой-нибудь замысловатый термин, а затем будете нажатием всего одной кнопки выводить это слово на экран;
  • Поддержка Gmail и других привычных для устройств на базе Android сервисов. Результаты начитки легко сохранять в облачном хранилище, пересылать контактам и т.д.

3. Dragon Dictation – приложение, чтобы набрать текст голосом для iPhone

Не думайте, что пользователей iPhone, iPad и прочей “яблочной” продукции обделили. В App Store тоже есть отличное приложение для голосового набора текста, и оно ничем не хуже вышеупомянутого аналога на Android (а в некоторых моментах даже лучше). Софт поддерживает пятнадцать языков и имеет несколько дополнительных функций вроде возможности быстро исправить неправильно распознанное слово – достаточно просто нажать на это слово, после чего в выпадающем списке высветится несколько похожих вариантов. Что-то подобное вы наверняка видели в процессе использования онлайн переводчиков.

Есть, конечно, и некоторые недостатки, несколько портящие итоговое впечатление от продукта. Самым неприятным из них является некорректное распознавание окончаний слов. Впрочем, приложение и не претендует на звание серьезного редактора – это скорее помощник в повседневных делах. Если нужно надиктовать себе список будущих дел для выполнения или покупок в супермаркете, Dragon Dictation справится без каких-либо проблем.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без  установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

Работая над голосовым управлением компьютеров, было создано много программ.


Распознанием речи с помощью компьютера
программисты-разработчики посвящали свои труды голосовому управлению
еще со времен Windows 95. За это время было создано много программ для
русского голосового управления компьютера и преобразования речи в
текст. Среди них набрали популярность такие программы:

  • Диктограф 5;
  • Перпетуум мобиле;
  • КОМБАТ
    Vocative Russian ASR Engine.

Для английской речи были популярными программы:

  • MedSpeak;
  • Sakrament ASR Engine;
  • ViaVoice;
  • Voice_PE;
  • Lucent;
  • VoiceType;
  • Sakrament;
  • Voice Xpress Pro;
  • iVoice;
  • Philips FreeSpeech 98;
  • SR-TTSC.

На сегодняшний день программы лидеры в данной области:

  • Горыныч 5;
  • Web Speech;
  • RealSpeaker;
  • Dragon (только для английского языка).

Эти четыре программы выдают наиболее оптимальный результат в
компьютерном преобразовании речи в команды и текст. Можно сказать, что
особо выбирать нет из чего. Проблема речевого преобразования в
компьютерные команды и текст является все еще актуальной. Это пока еще
свободная ниша для программистов-разработчиков. Еще очень мало создано
достойных продуктов в этой отрасли.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

источник

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий