Miglior testo di riga di comando alle app di discorso per Linux

Miglior testo di riga di comando alle app di discorso per Linux
Questo articolo coprirà un elenco di app Utitive Text to Speech (TTS) disponibili per Linux. Queste app possono identificare un pezzo di testo, convertirlo in discorso e quindi pronunciare parole e frasi attraverso gli altoparlanti del tuo sistema Linux. Convertono il testo in discorsi usando algoritmi di intelligenza artificiale e modelli di apprendimento automatico pretratto. Queste app di solito forniscono una serie di voci diverse con toni, accento e modo predefiniti. Alcune di queste app consentono di configurare parametri vocali come tempo e pitch. È comune che le app del discorso sono voci robotiche che non sembrano voci della vita reale. Tuttavia, la tecnologia sta migliorando e più voci del suono umano stanno uscendo da questi testi delle app di linguaggio.

Espeak

ESPEAK è un testo gratuito e open source all'utilità vocale che può essere utilizzato per convertire il testo in discorsi in molte lingue diverse. Viene fornito con un'utilità della riga di comando e una libreria che può essere utilizzata nella propria app. La maggior parte delle voci disponibili in espeak sonoro robotico ma è uno dei testi open source più completi e ampiamente usati per la parola disponibile oggi. Supporta la conversione del testo in discorsi in più di 40 lingue diverse e puoi anche salvare i file del discorso in file audio in formato file WAV. Viene inoltre fornito con supporto integrato per la conversione del testo in fonemi in modo da poterli utilizzare in altre app, incluso altri motori vocali.

È possibile installare EpSeak in Ubuntu usando il comando menzionato di seguito:

$ sudo apt install espeak

Puoi scaricare ESPEAK in altre distribuzioni Linux dal gestore dei pacchetti. Altre opzioni di download sono disponibili qui.

Per convertire un pezzo di testo in discorsi usando ESPEAK, usa un comando nel seguente formato:

$ espeak "Il testo verrà convertito in discorso."

Puoi sostituire il contenuto tra le citazioni con la tua stringa desiderata. Per sintetizzare l'intero contenuto di un file al discorso, eseguire un comando nel seguente formato:

$ espeak -f nome file.TXT

Per cambiare il linguaggio e lo stile vocale, eseguire un comando nel seguente formato:

$ espeak -v en -gb "Il testo verrà convertito in discorso."

Puoi sostituire "En-GB" con il codice vocale desiderato. Un elenco di tutte le voci disponibili e i loro codici possono essere trovati eseguendo il seguente comando:

$ ESPEAK --Voices

Per salvare il discorso sintetizzato in un file WAV, eseguire un comando nel seguente formato:

$ espeak -f nome file.output txt -w.Wav

È possibile sostituire "output.wav "con qualsiasi altro nome a tua scelta.

Per saperne di più su altre opzioni di riga di comando disponibili per ESPEAK, utilizzare i seguenti due comandi:

$ ESPEAK -HELP
$ uomo espeak

Festival

Il festival è un altro testo gratuito e open source al motore vocale che funziona in modo simile a espeak. Fornisce un'utilità della riga di comando per convertire il testo in discorso e un'API che puoi integrare nella propria app. Altre caratteristiche principali del festival includono il supporto per la conversione del testo in discorsi in più lingue, l'interprete interattivo integrato, un'API client-server per accedervi in ​​remoto e il proprio motore di scripting.

È possibile installare il festival in Ubuntu usando il comando menzionato di seguito:

$ Sudo Apt Installa Festival

Puoi scaricare il festival in altre distribuzioni Linux dal gestore dei pacchetti. Altre opzioni di download sono disponibili qui. Una demo online che mostra le capacità del festival è disponibile qui.

Per convertire una stringa in discorso, utilizzare un comando nel seguente formato:

$ echo "test" | Festival - -TTS

Puoi sostituire "test" con qualsiasi altra stringa di tua scelta. Per convertire il contenuto di un file di testo in discorso usando il festival, eseguire un comando nel seguente formato:

$ Festival -TTS FileName.TXT

Puoi cambiare il linguaggio vocale eseguendo il comando di seguito:

$ Festival -Language AmericanEnglish -TTS FileName.TXT

Puoi sostituire "AmericalEnglish" con altre lingue supportate dal festival. Per ottenere un elenco di tutte le lingue supportate, eseguire il comando di seguito:

$ ls/usr/share/festival/lingue/

Per eseguire il festival in modalità interattiva, utilizzare il seguente comando:

$ festival

Puoi saperne di più sui comandi specifici della modalità interattiva da qui.

Per saperne di più su altre opzioni di riga di comando disponibili per il festival, eseguire i seguenti due comandi:

$ Festival -Help
$ Man Festival

Pico Text to Speech Engine

PICO è un testo di testo gratuito e open source a un motore vocale incluso per impostazione predefinita in Android Open Source Project (AOSP). Gli stili vocali inclusi in pico tts suonano meno robotici di espeak e festival. Attualmente, Pico TTS supporta la sintesi del linguaggio in lingue inglese, italiano, tedesco, francese e spagnolo.

È possibile installare Pico TTS in Ubuntu usando il comando menzionato di seguito:

$ sudo apt installa libttspico-otils

Puoi scaricare Pico TTS in altre distribuzioni Linux dal gestore dei pacchetti. In alternativa, puoi compilarlo dal codice sorgente disponibile qui.

Pico ts non ha un comando per parlare direttamente il discorso sintetizzato da stdout. Tuttavia, può leggere il contenuto di un file di testo o di una stringa e può salvare il discorso sintetizzato in un file WAV che può quindi essere riprodotto in qualsiasi lettore audio.

Per convertire una stringa in discorso e salvare l'output in un file WAV, eseguire un comando nel seguente formato:

$ pico2wave -l eN -en -w test.Wav "test"

Puoi sostituire "test" con la tua stringa desiderata. Per cambiare il linguaggio, sostituire "en-en" con codici per altri linguaggi supportati. Pico TTS supporta i seguenti codici linguistici: en-us, it-it, es-es, en-gb, de-de e fr-fr.

Per leggere il contenuto di un file e convertirlo in discorso, eseguire un comando nel seguente formato:

$ pico2wave -l en -us -w test.WAV "$ (test gatto.TXT)"

Puoi sostituire “Test.txt "con qualsiasi altro nome di file.

Per saperne di più sulle opzioni della riga di comando Pico TTS, eseguire i seguenti due comandi:

$ pico2Wave -Help
$ man pico2wave

GTTS

GTTS è un'applicazione e una libreria di riga di comando basata sul testo di Google Translate in Speech Engine. Basato su Python, può essere utilizzato per sviluppare altre app TTS o puoi usarlo come utilità della riga di comando per sintetizzare il discorso dal testo. Presenta voci dal suono molto più naturale rispetto ad altre utility menzionate in questo articolo, poiché il testo di Google Translate in Speech Engine viene aggiornato abbastanza regolarmente con nuovi algoritmi, voci e caratteristiche dal suono naturale.

È possibile installare GTT in Ubuntu usando il comando menzionato di seguito:

$ sudo apt Installa python3-gtts

Puoi scaricare GTT in altre distribuzioni Linux dal gestore pacchetti. In alternativa, è possibile installarlo dal gestore dei pacchetti PIP.

Per convertire una stringa in discorso, eseguire un comando nel seguente formato:

$ GTTS-cli 'test'-Output Test.mp3

È possibile sostituire "test" con qualsiasi stringa. Il discorso sintetizzato viene salvato nel "test.File Mp3 ". È possibile utilizzare qualsiasi nome per il file di output.

Per leggere il contenuto di un file e convertirlo in discorso, eseguire un comando nel seguente formato:

Test $ GTTS -CLI.TXT -Output Test.mp3

Puoi sostituire “Test.txt "con qualsiasi altro nome di file.

Per specificare un linguaggio particolare per la sintesi di discorso, utilizzare un comando nel seguente formato:

$ gtts -cli 'test' -l en --output.mp3

È possibile sostituire "EN" con il codice per altre lingue supportate. Per ottenere un elenco di tutti i codici di lingua supportati, eseguire il seguente comando:

$ gtts-cli-all

Per saperne di più su altre opzioni di riga di comando disponibili per GTT, utilizzare i seguenti due comandi:

$ MAN GTTS-CLI
$ GTTS-CLI--HELP

Conclusione

Queste sono alcune delle migliori app di testo per il discorso disponibili per Linux forniti con il supporto per la sintesi di discorsi in più lingue. Queste app TTS possono essere utilizzate in vari modi, ma sono particolarmente utili per migliorare l'accessibilità per le persone che soffrono di problemi di alterazioni visivi.