Speech-To-Text – вопросы и ответы

131
голос
1
ответ
У меня возникла проблема с библиотекой распознавания голоса Sphinx для Java. Я использую его для ввода и обработки. В грамматическом файле я написал вот так: #JSGF V1.0; grammar hello; public <s...
4 месяца, 3 недели назад Si Bui
116
голосов
3
ответа
Я хотел бы создать кнопку, которая при нажатии будет активировать речь в Android-трансляции, как и тот, который предоставляется клавиатурой Android. В частности, я бы хотел, чтобы кнопка, в которой...
4 месяца, 3 недели назад Matt Fritze
-5
голосов
2
ответа
Использование Text To Speech в TextView отображает текст распознавания в квадратных скобках. Как их удалить? Например: вместо: автомобиль - [автомобиль] public class MainActivity extends AppCompatA...
4 месяца, 3 недели назад Nikolai
88
голосов
1
ответ
это первый раз, когда я задаю вопрос, поэтому, если подход не настолько стандартен, я извиняюсь, я понимаю, что есть много вопросов по этому вопросу, и я прочитал тон тезисов, вопросов, арифтанов и...
4 месяца, 3 недели назад UVZ
77
голосов
1
ответ
Есть ли способ отключить автоматическую коррекцию для Google Cloud Speech to Text API? Для меня важно получить точную расшифровку речи пользователя, с любыми ошибками, которые они делают, а не с ис...
4 месяца, 3 недели назад Karolis
63
голоса
1
ответ
Краткое описание: Приложение будет отображать случайные изображения пользователю, основанным на словах из файла банка слова, и пользователь должен будет идентифицировать имя изображения (одно слово...
4 месяца, 3 недели назад Brandon
63
голоса
1
ответ
Я использую Google Speech2Text API и хочу оптимизировать полученные результаты, исправляя непонятые слова, выполняя поисковые запросы Google, чтобы найти возможные фразы в выбранной теме. Есть ли с...
4 месяца, 3 недели назад Mari
100
голосов
1
ответ
Я работаю над задачей распознавания речи, которая включает в себя <сильное > обнаружение способности говорить с детьми, улучшение с течением времени... Я хотел бы использовать Google Cloud Sp...
4 месяца, 3 недели назад Asp
63
голоса
2
ответа
Некоторое время я боролся и просматривал множество примеров того, как включить микрофон в браузере с помощью Node.js. Я видел несколько примеров Javascript, но я не могу получить из них устный конт...
4 месяца, 3 недели назад ItsMeRileyP
77
голосов
3
ответа
Я не могу получить доступ к API-интерфейсу речи к тексту на IBM Bluemix с завитом! Я попробовал пример из документации для сеансового запроса с завитком, и это не сработало; Я получил неверное сооб...
4 месяца, 4 недели назад Lem
77
голосов
1
ответ
Я применил инструмент определения ключевых слов для pocketsphinx в своем приложении и включил его в липкую службу. Точка ключевого слова отлично работает! Проблема в том, что я больше не могу испол...
4 месяца, 4 недели назад user2812299
89
голосов
3
ответа
Я пытаюсь найти библиотеку распознавания речи, подобную PySpeech, которая будет работать на малине Pi 2. Я новичок в этом и пытаюсь исследовать, но есть так много приложений, мне просто нужна помощ...
5 месяцев назад Josh
-9
голосов
2
ответа
У меня вопрос совершенно пустой. Я тренирую глубокую модель на gpu, контрольные точки сохраняются в контрольных точках папки. Если я прерываю процесс обучения, как я могу использовать контрольные т...
5 месяцев назад kirill
63
голоса
1
ответ
Я пытаюсь создать приложение на С#, которое будет принимать поток аудио (из файла на данный момент, но позже это будет веб-поток) и вернуть транскрипции из Watson в режиме реального времени по мере...
5 месяцев назад JJJamie
64
голоса
1
ответ
Я пытаюсь сделать зачитанный веб-сайт с длинным текстом, который мы можем только читать, без какой-либо прокрутки. Но я не очень хорош с чистым JS, и я немного потерялся. Я попробовал распознавание...
5 месяцев назад Florian Fromager
99
голосов
4
ответа
Вот как я начал свое намерение RecogniseListener: Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUA...
5 месяцев назад Martis
63
голоса
2
ответа
Я хочу получить доступ к функциям TTS (Text-To-Speech) и STT (Speech-To-Text) iOS из веб-приложения. Поскольку веб-приложение не имеет доступа к функциям устройства ios, можно ли запустить приложен...
5 месяцев назад alhad
124
голоса
1
ответ
В настоящее время я пытаюсь записать звук, который пользователь говорит, чтобы он мог воспроизвести его позже, а также использовать API Google Speech to Text, чтобы я мог выполнять анализ слов, воз...
5 месяцев назад duebstep
108
голосов
2
ответа
Я сделал кодирование для преобразования речи в текст. Я просто хочу знать, какая минимальная версия андроида требуется для этого.
5 месяцев назад Nitin Gupta
126
голосов
2
ответа
Я пытаюсь использовать распознавание речи в .net для распознавания речи подкаста в mp3 файле и получения результата в виде строки. Все примеры, которые я видел, связаны с использованием микрофона, ...
5 месяцев назад Soham Dasgupta
77
голосов
1
ответ
Я новичок в SAPI, и я был бы очень признателен, если бы кто-нибудь из вас мог предоставить мне текст в формате Hello World в SAPI. Я знаю, что MS получила несколько примеров, таких как "Диктатура" ...
5 месяцев назад Soldier
77
голосов
1
ответ
Учитывая известную рукопись (текст), которую я ожидаю, что пользователь прочитает (более или менее точно), каков наилучший подход для распознавания прогресса пользователя в рукописи? Пока я ищу кон...
5 месяцев назад Mischa
76
голосов
1
ответ
Можно ли распознать wav файл из java, возможно ли это с помощью cloudgarden java speech api, это пример кода из примера cloudgarden, любое изменение необходимо для нашего собственного wav файла код...
5 месяцев назад athul
99
голосов
1
ответ
Я разработал приложение, которое использует текстовые и текстовые функции. При тестировании на разных устройствах я обнаружил, что некоторые устройства имеют предпочтения воспроизведения звука, кот...
5 месяцев назад embersofadyingfire
63
голоса
1
ответ
Я не могу найти никаких ссылок для транскрибирования потокового сервиса (из речи в текст) в AWS.NET SDK. Доступно ли оно в .NET SDK Amazon Transcribe Streaming Service? Любые ссылки будут полезны
5 месяцев назад Ashish Singh
126
голосов
1
ответ
В Windows Phone 7 мы можем конвертировать речевые или голосовые данные в текстовый формат. Пожалуйста, пришлите мне ссылку или объясните ее. В моем случае я хочу преобразовать речевые данные в текс...
5 месяцев назад Ankit Jain
63
голоса
1
ответ
Я использую Microsoft С# API для службы распознавания речи Bing Speech Services (Project Oxford). В частности, я использую Microsoft.ProjectOxford.SpeechRecognition-x64 версии 0.4.10.2. Я отправляю...
5 месяцев назад John Wiseman
118
голосов
1
ответ
Я пытаюсь разработать приложение, как речь в текст, я хочу, чтобы преобразовать речь в текст в текстовое поле. Я искал в google, я получил пример кода, но это не полезно. Я получил эту ссылку, rayw...
5 месяцев назад Agal Sivamanoj
63
голоса
1
ответ
Я экспериментирую с демонстрацией API веб-речи: https://www.google.com/intl/ru/chrome/demos/speech.html . Вам потребуется версия 25.0 Chrome, по крайней мере, для ее запуска. Я пытаюсь использовать...
5 месяцев назад T.S.
78
голосов
1
ответ
Я пытаюсь создать программу изучения польского/английского языка. Я использую С#, и в идеале хотел бы поддерживать Windows XP, Vista и (очевидно) более новые версии. Вначале компьютер выбирает како...
5 месяцев назад MSM
63
голоса
1
ответ
Можно ли использовать freetts , чтобы сделать что-то вроде преобразования речи в текст? Мне нужно определить определенный звук из аудиовхода с моего ноутбука, могу ли я сделать это freetts в java?
5 месяцев назад Am1rr3zA
-5
голосов
2
ответа
Кто-нибудь знает, как превратить этот код в ключ API для Watson речь в текст? <!-- STT default credentials --> <string name="STTdefaultUsername">yyyyyyyy</string> <string name=...
5 месяцев назад user896273
107
голосов
1
ответ
Я использую pocketsphinx для распознавания речи с испанской акустической моделью и грамматикой JSGF с достойными результатами. Тем не менее, я получаю ошибочные результаты распознавания с аудио, ко...
5 месяцев назад jotadepicas
63
голоса
1
ответ
Я внедрил IBM Watson Speech-to-Text, поэтому, когда я говорю "прыжок"/"гнев", мой персонаж будет проигрывать аудиоклип. Однако я получаю эту ошибку, которая мешает персонажу реагировать на мой голо...
5 месяцев назад June Wang
126
голосов
1
ответ
SpeechRecognitionEngine работает очень хорошо, если у меня есть загруженные грамматики, он всегда выбирает правильный. Но если я скажу что-то совершенно иное, чем две загруженные грамматики, он выз...
5 месяцев, 1 неделя назад Anders
117
голосов
1
ответ
Несколько дней назад мы начали видеть ошибки внутреннего сервера в ответах на запросы обучения пользовательской языковой модели Watson. Здесь появляется сообщение об ошибке: "error": "{\" code\": 5...
5 месяцев, 1 неделя назад Luffa
63
голоса
1
ответ
Я пытаюсь реализовать функцию Speech-to-text для приложения watchkit. Я ссылался на этот вопрос с образцом кода. Ниже приведен код, который я пробовал: self.presentTextInputControllerWithSuggestion...
5 месяцев, 1 неделя назад user2312896
63
голоса
1
ответ
Я пытаюсь выполнить асинхронный запрос google-speech-api. Как я посоветовал использовать команду play : play audio2min.flac <
5 месяцев, 1 неделя назад Albyorix
109
голосов
1
ответ
Я хотел бы использовать некоторый текст речи 2 в моем приложении на поверхности microsoft. Я видел, что это возможно, но я не знаю, с чего начать. Доступна ли какая-либо инфраструктура/библиотека, ...
5 месяцев, 1 неделя назад user4910881
77
голосов
1
ответ
Я использую единство watson SDK, чтобы принимать речь пользователя, анализировать его на текст и затем передавать текст в SDK "textToSpeechWidget", http://i.imgur.com/4xBhZYx.png . Я создал кнопку ...
5 месяцев, 1 неделя назад Julian
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема