Как использовать StreamingRecognize более 1 минуты?

Я новичок в использовании API речи Google. Мое приложение требует от меня непрерывной потоковой передачи аудиозапросов для распознавания речи. использование будет более 1 минуты непрерывно. Однако служба останавливается через 60 секунд в соответствии с ограничениями использования. Есть ли способ обойти эту проблему?

Любая помощь приветствуется.

Спасибо

google-speech-api

Faisal Dayani 23.10.2016 источник

Ответы (2)

arrow_upward
0
arrow_downward

Глубоко в облачной консоли Google скрыта ссылка на форму, где вы можете запросить увеличение некоторых лимитов. Однако, если возможно, используйте асинхронное распознавание, которое даст вам до 80 минут распознавания.

Чтобы перейти к форме увеличения лимита:

Перейдите в менеджер API в консоли.
Нажмите на Google Cloud Speech API.
Перейдите на вкладку «Квоты».
Прокрутите вниз до любой регулируемой квоты, например Discovery requests per 100 seconds.
Нажмите на значок «редактировать» справа от этого.
В этом всплывающем окне должна быть ссылка под названием «Подать заявку на более высокую квоту».

blambert 11.02.2017

arrow_upward
0
arrow_downward

Я решил эту проблему в приложении Node.js, создав серию запросов на потоковое распознавание.

Код находится здесь: https://github.com/marciovm/Speech-Forever.

Хитрость заключается в том, чтобы запрашивать новые потоки на стороне клиента (из браузера пользователя или его эквивалента) в подходящий перерыв во входной речи.

Ключевой раздел на app.js (сервер Node)

var gstreams = []; // keeep track of speech streams
  var activeStreamID = -1; // pointer to active speech stream
  ws.on('message', function (data) {         
    if ( typeof data == 'string' ) { 
      if (data.indexOf("info")>0) { // client sends an info string on connection that triggers server to start a speech stream             
        console.log('Start first stream');
        gstreams.push(startGoogleSpeechStream(ws));
        activeStreamID = activeStreamID + 1;           
      }
      else { // client requested a new speech stream (client-side logic allows for triggering on a lull in input volume)
        console.log('Start another stream');
        gstreams[activeStreamID].end();
        gstreams.push(startGoogleSpeechStream(ws));
        activeStreamID = activeStreamID + 1;                              
      }    
    }    
    else  { 
      gstreams[activeStreamID].write(data); // client sent audio, push it to active speech stream 
    }        
  });

Ключевой раздел на demo.js (клиентский браузер)

var handleSuccess = function(stream) {
    setRecordingTrue(1000); // give socket 1 sec to open
    audioInput = context.createMediaStreamSource(stream);   
    audioInput.connect(recorder);            
    recorder.onaudioprocess = function(stream){
      if(!recording) return;
      var buf = stream.inputBuffer.getChannelData(0);             
      volume = detectVolume(buf, this);               
      $(".volume_meter")[0].value=volume * 100;      
      if (volume < 0.01 && (Date.now() > (streamStartTime + breakTime))) {    
        ws.send("restarting Google Stream");  
        console.log("restarting Google Stream");
        streamStartTime = Date.now();
        writeToCaret(' ');
      }   
      else {
        ws.send(float32ToInt16(buf)); // send audio stream to Node server   
      }     
    }    
  }

marciovm 30.10.2017

Как использовать StreamingRecognize более 1 минуты?

Ответы (2)

Похожие вопросы