Speech-Recognition – вопросы и ответы

125
голосов
1
ответ
У меня возникла проблема с библиотекой распознавания голоса Sphinx для Java. Я использую его для ввода и обработки. В грамматическом файле я написал вот так: #JSGF V1.0; grammar hello; public <s...
11 часов назад Si Bui
-4
голоса
1
ответ
try: print r.recognize_google(audio) return r.recognize_google(audio) speech except sr.UnknownValueError: assistant(myCommand()) И здесь ошибка: File "/Users/user/Downloads/J.A.R.V.I.S-master/scrip...
13 часов назад tetytey
85
голосов
1
ответ
Экземпляр FloatingActionButton fab = (FloatingActionButton) findViewById(R.id.fab); здесь он должен был начать слушать пользователя fab.setOnClickListener((view) -> { Intent intent = new Intent(...
14 часов назад Felipe Teixeira
95
голосов
1
ответ
Я начинаю свой последний проект. Я сделаю приложение для Android, которое возьмет команды от пользователя, а затем обработает вход, чтобы показать результаты. Мой вопрос в том, какие способы я могу...
15 часов назад N4LN
126
голосов
1
ответ
Я ищу бесплатный (FOSS) механизм распознавания речи, который я могу использовать с моим программным обеспечением GPL на основе PHP. Какие-нибудь предложения, которые являются одними из лучших качес...
15 часов назад dave
115
голосов
2
ответа
Я разрабатываю систему распознавания речи с нуля с помощью Octave. Я пытаюсь обнаружить фонемы, обнаруживая различия в частоте. В настоящее время я прочитал в wav файле, организовал значения в блок...
19 часов назад user2809184
86
голосов
2
ответа
Я использую С#, чтобы сделать приложение для распознавания речи, и я пытаюсь одновременно использовать несколько грамматик. То, что я имею в виду, это получение слов из обоих грамматик с тем же пре...
1 день назад Mohammed Khalaila
60
голосов
1
ответ
Я создаю программу, похожую на JARVIS от железного человека, основанную на распознавании речи. Я сделал один, прежде чем использовать это: case "Open facebook": JARVIS.Speak("Opening facebook"); Pr...
1 день, 14 часов назад D'Jok
61
голос
2
ответа
Я хочу использовать намерение Android Recognition для прослушивания IP-адресов для ввода адреса громкой связи. Эксперименты с ним с использованием LANGUAGE_MODEL_FREE_FORM были менее успешными; для...
1 день, 15 часов назад fixermark
61
голос
1
ответ
Мне просто нужна библиотека распознавания речи в Linux. Затем я выбираю CMU Sphinx и использую pocketSphinx с python. Я тестирую эту демонстрацию . Этот пример хорошо работает на моем компьютере с ...
1 день, 18 часов назад madper
94
голоса
2
ответа
Как описано в нескольких книгах, процесс распознавания изолированных слов состоит из следующего: Для заданного набора сигналов (шаблонов) определите вектор признаков для каждой матрицы-матрицы M × ...
1 день, 18 часов назад Zagavarr
-4
голоса
2
ответа
Использование Text To Speech в TextView отображает текст распознавания в квадратных скобках. Как их удалить? Например: вместо: автомобиль - [автомобиль] public class MainActivity extends AppCompatA...
1 день, 18 часов назад Nikolai
-4
голоса
1
ответ
Прежде всего, этот вопрос сделан из-за моего отсутствия знаний о технологиях, связанных с окнами. Теперь вопрос. Я сделал приложение для распознавания речи, используя Windows Speech API, используя ...
1 день, 19 часов назад Yohan Weerasinghe
87
голосов
1
ответ
Я хочу уметь предсказать язык слов в устной речи, а затем использовать соответствующие языковые и акустические модели в cmu sphinx Но я не знаю, где искать языковые оценки для каждого слова
1 день, 20 часов назад Roma Jain
59
голосов
1
ответ
Я новичок в этом деле и надеюсь, что кто-то может указать мне верное направление: я использовал Google Cloud Speech-to-text API, в частности метод longrunningrecognize. Теперь все работает, и я пол...
1 день, 21 час назад Ted
84
голоса
1
ответ
это первый раз, когда я задаю вопрос, поэтому, если подход не настолько стандартен, я извиняюсь, я понимаю, что есть много вопросов по этому вопросу, и я прочитал тон тезисов, вопросов, арифтанов и...
1 день, 21 час назад UVZ
201
голос
3
ответа
Я пытаюсь создать службу для непрерывного распознавания речи в Android 4.2. Используя ответ по этой ссылке ( Android Speech Recognition как услуга на Android 4.1 и 4.2 ), я создал службу, которая з...
1 день, 23 часа назад rmooney
-6
голосов
1
ответ
У меня есть функция, которая возьмет string и удалит ее первое слово и всегда сохранит последнее слово. Строка возвращается из моей функции SFSpeechRecognitionResult result . С моим текущим кодом о...
1 день, 23 часа назад Carlos Rodrigez
75
голосов
1
ответ
Я разрабатываю приложение, предназначенное для запуска только как сервис. То есть у него нет Activity (как правило, выполняется, по крайней мере), и в любой данный момент единственным компонентом п...
2 дня назад matteo
61
голос
1
ответ
Как правило, мы можем признать речь по этому поводу: Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LA...
2 дня, 14 часов назад Aleksandr
94
голоса
1
ответ
Скажите что-то! Traceback (most recent call last):<br/> File "speechrecognition.py", line 17, in <module><br/> print("You said: " + r.recognize_google(audio))<br/> File "C:\...
2 дня, 17 часов назад frankenstein
119
голосов
1
ответ
У меня звук воспроизводится в фоновом режиме, пока человек говорит, мне нужно обнаружить определенное слово из микрофона, я должен убедиться, что обнаруженное слово не из записанного голоса (звук, ...
2 дня, 19 часов назад M.ArslanKhan
95
голосов
1
ответ
Я работаю над задачей распознавания речи, которая включает в себя <сильное > обнаружение способности говорить с детьми, улучшение с течением времени... Я хотел бы использовать Google Cloud Sp...
2 дня, 21 час назад Asp
-4
голоса
1
ответ
Я разрабатываю речевое приложение на С#. Средства распознавания речи отлично работают с SAPI 5.1 в Windows XP. Но теперь у меня есть Microsoft Speech Recognizer v 6.1 на моей машине, которая постав...
2 дня, 22 часа назад user26242
60
голосов
1
ответ
Я работаю над системой распознавания голоса с помощью Raspberry pi 3B, и при запуске некоторого кода я сталкиваюсь с проблемой, которая приведена ниже. Я был опробован так много продуктов из Интерн...
3 дня, 14 часов назад Mr. Jay Patel
84
голоса
1
ответ
Создание приложения для Android с компонентом распознавания речи. Я создал файл ключевого слова.gram, содержащий слова 3.240, которые я хочу распознать. Я построил соответствующий словарь (фонетиче...
3 дня, 16 часов назад Kees Koenen
74
голоса
1
ответ
У меня есть задержка при попытке передать аудио в систему распознавания речи. У меня есть две функции, которые обрабатывают эту задачу, первую, которая использует alsaaudio и "yield", чтобы вернуть...
3 дня, 17 часов назад LichKing
60
голосов
1
ответ
Я использую С#.Net для разработки механизма распознавания речи, чтобы развить речь в тексте в bangla. Я несколько раз пытался загрузить файл грамматики в речевой журнал. Но это показывает мне ошибк...
3 дня, 21 час назад Prodip
60
голосов
1
ответ
Можно ли сделать Mac OS X "ping", когда он распознает ключевое слово Recognition? Он пишет, когда распознает фразу, но немного отличается. Мое распознавание речи отлично работает без ключевого слов...
3 дня, 21 час назад barrycarter
134
голоса
3
ответа
Я использую распознавание речи в своем приложении. Когда я впервые представляю контроллер представления с логикой распознавания речи, все работает нормально. Однако, когда я пытаюсь представить кон...
4 дня назад Appache99
61
голос
1
ответ
Wowza дает мне rtsp://, rtmp://и m3u8 потоки. Я хочу отправить его в Google Cloud Speech API, поэтому он транскрибирует потоковое вещание "на лету". Этот API, похоже, способен принимать только чист...
4 дня, 17 часов назад RichardW
85
голосов
2
ответа
Я установил SpeechRecognition, как указано в https://github.com/Uberi/speech_recognition pip install SpeechRecognition В настоящее время я использую python 3.5 на моей малине Pi 3. У установки нет ...
4 дня, 18 часов назад Pythoner
73
голоса
1
ответ
У меня возникают серьезные проблемы с попыткой реализовать образец, предоставленный Microsoft, о том, как использовать SpeechRecognitionEngine ( https://msdn.microsoft.com/en-us/library/system.spee...
4 дня, 22 часа назад DankMetalSounds
85
голосов
1
ответ
Читая другие вопросы и ответы, которые находятся на stackoverflow и информацию на официальном сайте CMUSphinx, я читал, что мне нужно настроить порог, но никто точно не говорит, каков порог. Я поня...
4 дня, 23 часа назад Andrei Daniel Borlea
84
голоса
3
ответа
Я пытаюсь найти библиотеку распознавания речи, подобную PySpeech, которая будет работать на малине Pi 2. Я новичок в этом и пытаюсь исследовать, но есть так много приложений, мне просто нужна помощ...
5 дней, 13 часов назад Josh
60
голосов
3
ответа
У меня есть файл mlt.ctl, в котором текст устроен так: znrmi_001/znrmi_001_001 znrmi_001/znrmi_001_002 znrmi_001/znrmi_001_003 zntoy_001/zntoy_001_001 zntoy_001/zntoy_001_002 zntoy_001/zntoy_001_00...
5 дней, 17 часов назад Andy
182
голоса
1
ответ
Я нашел много библиотек, таких как flite , которые могут быть использованы, как указано в здесь , но я хочу знать, есть ли какой-либо встроенный класс, предоставляемый iOS SDK, подобный NSSpeechRec...
5 дней, 18 часов назад Krishna
179
голосов
2
ответа
Я занимаюсь разработкой речи и текста и текста в речь, и я нашел OpenEars API очень полезным. Принцип этого API cmu-slm основан на использовании языковой модели для сопоставления речи, прослушиваем...
5 дней, 19 часов назад harshalb
60
голосов
1
ответ
Я пытаюсь создать приложение на С#, которое будет принимать поток аудио (из файла на данный момент, но позже это будет веб-поток) и вернуть транскрипции из Watson в режиме реального времени по мере...
5 дней, 19 часов назад JJJamie
62
голоса
1
ответ
Я пытаюсь сделать зачитанный веб-сайт с длинным текстом, который мы можем только читать, без какой-либо прокрутки. Но я не очень хорош с чистым JS, и я немного потерялся. Я попробовал распознавание...
5 дней, 20 часов назад Florian Fromager
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема