Question Texte de sondage naturel à la parole?


Je cherche un logiciel facile à installer pour Ubuntu qui semble naturel. J'ai installé Festival, Gespeaker, etc., mais rien ne semble très naturel. Tout est très synthétique et difficile à comprendre.

Des recommandations là-bas?


77
2017-07-20 17:36


origine


Duplicata possible de Comment puis-je installer et utiliser un logiciel de synthèse vocale? - Organic Addict


Réponses:


SVOX pico2wave

En plus des autres réponses:

Un TTS très minimaliste, qui sonne mieux que espeak ou mbrola (à mon avis).

Des informations:
https://launchpad.net/ubuntu/precise/+source/svox/

Je ne comprends pas pourquoi pico2wave est, comparé à espeak ou mbrola, rarement discuté. C'est petit mais ça sonne vraiment bien (naturel). Sans modification, vous entendrez une voix féminine au son naturel.

ET ... comparé à Mbrola, il reconnaît les Unités et le dit correctement!
Par exemple:

  • 2 ° C → deux degrés
  • 2m → deux mètres
  • 2kg → deux kilos

Après l'installation, je l'utilise dans un script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Puis lancez-le avec le texte désiré:

<scriptname>.sh "hello world"

ou lisez le contenu d'un fichier entier:

<scriptname>.sh "$(cat <filename>)"

C'est tout pour avoir un TTS léger et stable sur Ubuntu.


48
2017-08-24 15:12



Pour autant que je sache, il n'utilise que les paramètres cli en entrée. Est-ce que je peux obtenir pico2wave pour lire le texte d'un nom de fichier? - Carlos Eugenio Thompson Pinzón
pico2wave est en paquet libttspico-utils dans les versions récentes d'ubuntu. @ CarlosEugenioThompsonPinzón cat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo - naught101
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)" =). Convenez que cette interface CLI est de mauvaise conception: contrairement à la grande majorité des interfaces de ligne de commande, et qu'il est possible d'atteindre le OS max CLI arg longueur. - Ciro Santilli 新疆改造中心 六四事件 法轮功
@Koen je ne sais pas! :-) Comme tout autre problème, essayez de produire un exemple minimal, par exemple en utilisant echo {1..1000} - Ciro Santilli 新疆改造中心 六四事件 法轮功
@ user49557 Nous ne sommes pas censés détourner les questions des autres, alors vous pouvez peut-être créer une nouvelle question en vous expliquant ce que vous avez installé et ce qui a mal tourné. , Je ne suis pas un expert: P) - Koen


Je crois que j'ai trouvé le meilleur logiciel TTS gratuitement en utilisant une extension Google Chrome appelée "SpeakIt". Cela ne fonctionne que dans le navigateur Chrome pour Ubuntu. Cela ne fonctionne pas avec le chrome pour une raison quelconque. SpeakIt est livré avec deux voix féminines qui semblent toutes deux très réalistes par rapport à tout ce qui existe ailleurs. Il existe au moins quatre voix masculines et féminines supplémentaires dans la liste des extensions Chrome si vous effectuez une recherche dans Chrome Web Store à l'aide de la requête "TTS".

https://chrome.google.com/webstore/detail/speakit/pgeolalilifpodheeocdmbhehgnkkbak?utm_source=chrome-ntp-icon

Pour une utilisation sur un site Web. vous mettez en surbrillance le texte que vous voulez lire et faites un clic droit et "SpeakIt" ou cliquez sur l'icône SpeakIt ancrée dans la barre supérieure de Chrome.

Les utilisateurs de Firefox ont également deux options. Dans les addons de Firefox, faites une recherche sur TTS et vous devriez trouver "Click Speak" et "Text to Voice". Les voix ne sont pas aussi bonnes que les voix Chrome SpeakIt, mais sont définitivement utilisables.

L'extension SpeakIt utilise la technologie iSpeech et, pour un prix de 20 dollars par an, le site peut convertir du texte en fichiers audio MP3. Vous pouvez saisir du texte, des URL, des flux RSS, ainsi que des documents tels que TXT, DOC et PDF et les imprimer en MP3. Vous pouvez faire du podcast, intégrer de l'audio, etc. Voici un lien ...

http://www.ispeech.org/free.text.to.speech.tts.software

et un échantillon de leur audio (ne sais pas combien de temps le lien durera) ...

http://www.ispeech.org/view/681080/4429622


19
2018-01-27 00:11



Malheureusement, aucune des options du navigateur ne fonctionne pour les fichiers PDF. En avez-vous rencontré un qui le fait? Je voudrais pouvoir sélectionner des paragraphes à lire à partir d’un PDF (c’est-à-dire ne pas avoir à coller des bits au terminal ou à un autre) - kungfujam
cette extension fonctionne pour moi sur le chrome 50.0.2661.94 en utilisant Debian 8.4 et c'est génial! J'aime particulièrement la voix féminine anglaise. Le seul reproche que je ferais, c’est qu’il s’arrête trop longtemps sur des virgules. - mulllhausen
Il prononce souvent mal les mots et prend également du temps pour envoyer le texte à un serveur distinct plutôt que d'utiliser votre propre système. - Goddard


Simple Google TTS

En raison de l'absence d'une meilleure alternative, j'ai écrit un script bash qui s'interface avec un script perl de Michal Fapso fournir TTS via Google Translate. De la description du projet:

L'intention est de fournir une interface facile à utiliser pour la sortie de synthèse vocale via le système de synthèse vocale de Google. Une option de secours utilisant pico2wave fournit automatiquement une synthèse TTS au cas où aucune connexion Internet ne serait trouvée.

En l'état actuel, l'encapsuleur prend en charge la lecture depuis l'entrée standard, les fichiers texte et la sélection X (texte en surbrillance).

Les principales caractéristiques sont les suivantes:

  • synthèse TTS en ligne via Google translate
  • synthèse TTS hors ligne via pico2wave
  • prend en charge une variété de langues différentes
  • peut lire de CLI, des fichiers texte et du texte en surbrillance
  • prend en charge la lecture de texte en surbrillance avec un formatage fixe (par exemple, des fichiers PDF)

L'installation et l'utilisation sont documentées sur le page du projet.

Je serais heureux si vous avez essayé. Rapports de bugs et autres commentaires sont les bienvenus!


11
2017-08-23 19:18



Ce doit être l'un des projets les plus cool que j'ai jamais vu. Juste wow.
Ceci n'est plus maintenu. - Goddard


J'ai semblé haut et bas pour le texte à parler pour Ubuntu qui est de haute qualité. Il n'y en a pas. Mes cordes vocales sont paralysées, donc j'avais besoin de TTS pour ajouter des instructions vocales à mon Vidéos Ubuntu. Vous pouvez obtenir des logiciels de synthèse vocale Linux de qualité commerciale: http://wizzardsoftware.com/att_desktop_overview.php  C'est vraiment très cher. J'ai fini par acheter Natural Reader pour Windows (ne fonctionne pas sous Ubuntu sous Wine) pour 40 $. Peut-être que plus tard je vais avoir celui de Linux.

J'espère que ça aide.


8
2017-07-20 17:57



mec, il y a et je l'utilisais comme la semaine dernière il y a au moins 5 ou 6 et je ne peux pas pour la vie de moi en trouver maintenant, je dois aimer notre communauté - mchid
Textaloud a des instructions pour que leur produit fonctionne sous le vin. voir nextup.com/forum/viewtopic.php?t=3349   Je crois que cepstral a aussi un port Linux. Je n'ai pas réussi à faire fonctionner mon logiciel préféré balabolka. J'ai Windows 10 installé principalement pour le traitement de tts. MS David est bon et similaire à cepstral david. Le précédent est gratuit si vous avez Windows 10. - Bhikkhu Subhuti


J'ai mené des recherches sur le meilleur son et le texte facilement ajusté aux voix. Vous trouverez ci-dessous une liste de ce que je pensais être les 5 meilleurs produits par ordre de qualité sonore. La plupart des sites Web associés à ces produits ont une démo interactive qui vous permettra de faire votre propre détermination.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & T Natural voix
  5. CereProc Voices

6
2018-04-24 15:35



existe-t-il des versions pour Linux? Je ne le pense pas - Mehdi Khademloo


Pico et espeak sont amusants et faciles à se mettre au travail, mais ils ne sont pas très bons. Les voix par défaut du Festival ne sont pas très bonnes. Cependant, Festival est un système de discours basé sur des schémas, dans lequel un certain nombre de chercheurs ont construit de meilleures voix de plug-in. Vous pouvez facilement surpasser la qualité de pico2wave en stock chez Ubuntu, car l'une de ces voix est disponible sous forme de package prêt à l'emploi.

Pour que le Festival soit naturel, voici ce qu'il faut faire:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Vous pouvez le faire depuis la ligne de commande en utilisant -b (ou --batch) et mettre chaque commande en guillemets simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Vous pouvez obtenir d’autres bonnes voix du référentiel Nitech, mais leur installation est difficile et les chemins par défaut ont été modifiés pour que les références de noms de fichiers dans le fichier groupé doivent être modifiées manuellement pour fonctionner sur Ubuntu.


6
2018-04-25 19:31



Btw, dans Ubuntu 16.04, ce paquet semble manquer. Vous pouvez télécharger et installer le deb à partir de Debian et cela fonctionnera très bien: packages.debian.org/sid/all/festvox-us-slt-hts/downloadsudo dpkg -i Téléchargements / festvox-us-slt-hts_0.2010.10.25-2_all.deb - Jon Watte


Combinez les outils SVOX (pico) avec LibreOffice:

Les outils SVOX (pico) sont faciles à installer et apportent des voix de qualité dans Ubuntu. Installez-le:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant le Extension "Lire le texte" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:

Configurer les options de lecture de l'extension de texte avec Outils - Modules complémentaires - Sélection en lecture .... Utilisation / usr / bin / python comme programme externe. Sélectionnez une option de ligne de commande qui inclut le jeton (PICO_READ_TEXT_PY), vous voudrez peut-être en expérimenter certaines.

Maintenant, il vous suffit de sélectionner du texte dans LO Writer, Calc, Impress ou Draw et de cliquer sur l'icône ajoutée en tant que barre d'outils (un visage heureux avec un ballon).


5
2017-12-15 00:48





Je trouve les voix de Nitech HTS sur le festival très naturelles et réconfortantes par rapport aux autres voix que j'ai entendues. Voir ce lien sur la façon de mettre en place Nitech et autres sons avec festival. Je n'ai pas trouvé de bonne interface graphique que je puisse utiliser pour configurer ces voix, mais leur configuration via festival.scm fonctionne toujours. Cet article est très ancien et vous voudrez peut-être trouver le répertoire d'installation réel en utilisant Commande "localiser festival"


4
2017-11-09 13:56



Semble être très bon. Démos trouvées ici cstr.ed.ac.uk/projects/festival/onlinedemo.html - Iacchus
Oui, les voix Nitech sont les têtes et les épaules au-dessus des autres voix du Festival (sauf les voix CMU, qui sont également très bonnes). Dommage qu'elles soient difficiles à installer. Il y a une bonne voix CMU qui a un paquet par défaut dans Ubunut, elle s'appelle cmu_us_slt_arctic_hts et vient dans le paquet festvox-us-slt-hts. C'est bien mieux que pico ou espeak! - Jon Watte