Discorso al testo

Discorso al testo
Il riconoscimento vocale è una tecnica che converte la voce umana in testo. Questo è un concetto molto importante nel mondo dell'intelligenza artificiale in cui dobbiamo dare comandi a una macchina come un'auto senza conducente, ecc.

Implementeremo il discorso al testo in Python. E per questo, dobbiamo installare i seguenti pacchetti:

  1. PIP Installa il riconoscimento vocale
  2. PIP Installa PyAudio

Quindi, importiamo il riconoscimento vocale della biblioteca e inizializziamo il riconoscimento vocale perché senza inizializzare il riconoscimento, non possiamo usare l'audio come input e non riconoscerà l'audio.

Esistono due modi per passare l'audio di input al riconoscimento:

  1. Audio registrato
  2. Usando il microfono predefinito

Quindi, questa volta stiamo implementando l'opzione predefinita (microfono). Ecco perché stiamo recuperando il microfono del modulo, come mostrato di seguito:

Con Linuxhint.Microfono () come microfono

Ma, se vogliamo utilizzare l'audio preregistrato come input di origine, la sintassi sarà così:

Con Linuxhint.Audiofile (fileName) come fonte

Ora stiamo usando il metodo record. La sintassi del metodo record è:

Record (fonte, durata)

Qui la fonte è il nostro microfono e la variabile di durata accetta numeri interi, che è secondi. Passiamo la durata = 10 che indica al sistema quanto tempo il microfono accetterà la voce dall'utente e quindi lo chiude automaticamente.

Quindi usiamo il riconoscere_google () metodo che accetta l'audio e coperto l'audio a un modulo di testo.

Il codice sopra accetta l'input dal microfono. Ma a volte, vogliamo dare input dall'audio preregistrato. Quindi, per questo, il codice è riportato di seguito. La sintassi per questo era già spiegata sopra.

Possiamo anche cambiare l'opzione linguistica nel metodo riconoscere. Mentre cambiamo la lingua dall'inglese all'hindi, come mostrato di seguito: