[Exelvision] Synthèse vocale
Modérateurs : Papy.G, fneck, Carl
[Exelvision] Synthèse vocale
Vous souvenez-vous des difficultés pour créer les chaînes LPC à envoyer au synthétiseur vocal TMS5220 ?
Un passionné du TMS5220 a créé tout un vocabulaire de chaînes LPC en français, permettant de composer des phrases en ligne sur ce site : http://www.technozone51.fr/BlocklyDuinotest/speech.php
Il existe aussi une émulation du TMS5220 à base d'Arduino. Je compte l'essayer à l'occasion.
http://www.technozone51.fr/dokuwiki2/do ... es_arduino
Merci à Christophe G. de m'avoir communiqué ces informations. Ces nouveautés pourraient donner envie aux programmeurs Exelvision de reprendre leurs développements.
Un passionné du TMS5220 a créé tout un vocabulaire de chaînes LPC en français, permettant de composer des phrases en ligne sur ce site : http://www.technozone51.fr/BlocklyDuinotest/speech.php
Il existe aussi une émulation du TMS5220 à base d'Arduino. Je compte l'essayer à l'occasion.
http://www.technozone51.fr/dokuwiki2/do ... es_arduino
Merci à Christophe G. de m'avoir communiqué ces informations. Ces nouveautés pourraient donner envie aux programmeurs Exelvision de reprendre leurs développements.
Daniel
L'obstacle augmente mon ardeur.
L'obstacle augmente mon ardeur.
Re: [Exelvision] Synthèse vocale
C'est intéressant ce travail.
Cependant les résultats donnent souvent une élocution peu naturelle en utilisant cette technique de combinaison de mots ou phonèmes préfabriqués, et très synthé de paroles justement... en particulier avec le TMS5220 qui ne fonctionne pas avec une base de phénomènes/mots mais qui est bien plus puissant.
L'outil un peu vieux qu'on avait utilisé permettant de transcrire en chaine LPC un fichier WAV, contenant une phrase enregistré par un humain ou fabriqué par un synthé de paroles modernes, donnait des résultats assez ""naturels" avec une élocution supportable... et surtout on retrouvait les intonations de la voix d'origine.
Il faudrait que j'essaie ces outils même si je suis septique sur le rendu final.
Mais le plus intéressant ou utile (si on peut parler d'utile) serait de générer une chaine LPC pour des bruitages... on avait réussi avec ce vieil outil, mais de manière limitée et pour des catégories de bruits spécifiques. L'intérêt est d'avoir avec le 5220 un bruitage correct sur qqs centaines voir qqs petits kilo au lieu de centaines de Ko voir Mo.
Nous avions fait tenir sur une simple disquette plus de bruitage et de dialogue que pour la plupart des jeux post 90 sur PC... il y a donc un potentiel très fort. Et personne n'a réussi à obtenir des chaines LPC de la qualité de celle d'époque (autant pour les paroles que les bruitages), générées par Texax pour le compte d'Exelvision... c'est vraiment dommage d'avoir perdu cette connaissance au fond des archives de Texas.
La mode est aujourd'hui à l'Arduino, mais il n'y a aucun progrès par rapport aux bidouilles réalisée depuis cette époque: personne n'est vraiment capable d'exploiter le TMS5220 et cette vieille techno de Texas.
C'est bien la seule chose qui pourrait me faire reprendre mes délires sur Exelvision: qu'un Pro en traitement du signal produise un outil ou nous explique comment exploiter ce TMS5220 comme le faisait à l'époque Exelvision (avec la puissance de calcul d'aujourd'hui). Emuler sur Arduino, faire prononcer des phrases à l'aide d'un vocabulaire préfabriqué... ça ne fait quère avancer le problème véritable mais ça peut aider à améliorer l'émulation.
Cependant les résultats donnent souvent une élocution peu naturelle en utilisant cette technique de combinaison de mots ou phonèmes préfabriqués, et très synthé de paroles justement... en particulier avec le TMS5220 qui ne fonctionne pas avec une base de phénomènes/mots mais qui est bien plus puissant.
L'outil un peu vieux qu'on avait utilisé permettant de transcrire en chaine LPC un fichier WAV, contenant une phrase enregistré par un humain ou fabriqué par un synthé de paroles modernes, donnait des résultats assez ""naturels" avec une élocution supportable... et surtout on retrouvait les intonations de la voix d'origine.
Il faudrait que j'essaie ces outils même si je suis septique sur le rendu final.
Mais le plus intéressant ou utile (si on peut parler d'utile) serait de générer une chaine LPC pour des bruitages... on avait réussi avec ce vieil outil, mais de manière limitée et pour des catégories de bruits spécifiques. L'intérêt est d'avoir avec le 5220 un bruitage correct sur qqs centaines voir qqs petits kilo au lieu de centaines de Ko voir Mo.
Nous avions fait tenir sur une simple disquette plus de bruitage et de dialogue que pour la plupart des jeux post 90 sur PC... il y a donc un potentiel très fort. Et personne n'a réussi à obtenir des chaines LPC de la qualité de celle d'époque (autant pour les paroles que les bruitages), générées par Texax pour le compte d'Exelvision... c'est vraiment dommage d'avoir perdu cette connaissance au fond des archives de Texas.
La mode est aujourd'hui à l'Arduino, mais il n'y a aucun progrès par rapport aux bidouilles réalisée depuis cette époque: personne n'est vraiment capable d'exploiter le TMS5220 et cette vieille techno de Texas.
C'est bien la seule chose qui pourrait me faire reprendre mes délires sur Exelvision: qu'un Pro en traitement du signal produise un outil ou nous explique comment exploiter ce TMS5220 comme le faisait à l'époque Exelvision (avec la puissance de calcul d'aujourd'hui). Emuler sur Arduino, faire prononcer des phrases à l'aide d'un vocabulaire préfabriqué... ça ne fait quère avancer le problème véritable mais ça peut aider à améliorer l'émulation.
-
- Messages : 7964
- Inscription : 18 sept. 2010 12:08
- Localisation : Brest et parfois les Flandres
Re: [Exelvision] Synthèse vocale
Comment marche le TMS5220: est-ce une série d'oscillateurs qui sont régulièrement pilotés par le CPU?
Si c'est le cas, le projet FRODIGI (Free Running Oscillator) sur C64 montre les progrès et ce qu'on peut obtenir au bout de pas mal d'années de dev avec un chip capable de piloter 3 sinusoïdes indépendantes: http://csdb.dk/getinternalfile.php/1348 ... epaper.pdf
La 1ère video montre qu'on part de très loin, mais dès la 2eme la reproduction de la parole de Madonna est déjà très reconnaissable. Et oui, ils obtiennent 3-4mins de chansons dans 64k à peu près.
Si c'est le cas, le projet FRODIGI (Free Running Oscillator) sur C64 montre les progrès et ce qu'on peut obtenir au bout de pas mal d'années de dev avec un chip capable de piloter 3 sinusoïdes indépendantes: http://csdb.dk/getinternalfile.php/1348 ... epaper.pdf
La 1ère video montre qu'on part de très loin, mais dès la 2eme la reproduction de la parole de Madonna est déjà très reconnaissable. Et oui, ils obtiennent 3-4mins de chansons dans 64k à peu près.
Samuel.
A500 Vampire V2+ ^8^, A1200 (030@50mhz/fpu/64mb/cf 8go),
A500 GVP530(MMU/FPU) h.s., R-Pi, TO9, TO8D, TO8.Démos
A500 Vampire V2+ ^8^, A1200 (030@50mhz/fpu/64mb/cf 8go),
A500 GVP530(MMU/FPU) h.s., R-Pi, TO9, TO8D, TO8.Démos
Re: [Exelvision] Synthèse vocale
Je viens de commander un TMS5220, ça ne vaut pas bien cher sur ebay.
Faut-il absolument la ROM TMS6100 qui va avec ?
Je cherche des conditions d'emploi avec un Arduino, ou autre PIC...
Pierre.
Faut-il absolument la ROM TMS6100 qui va avec ?
Je cherche des conditions d'emploi avec un Arduino, ou autre PIC...
Pierre.
Re: [Exelvision] Synthèse vocale
La ROM série contient du vocabulaire préprogrammé, elle est donc dispensable.
Re: [Exelvision] Synthèse vocale
Ok Fabrice, merci pour l'info.
J'en ai trouvé de pas trop cher sur ebay, mais frais de port élevé... je cherche.
As tu lu mon message sur le TI99 : as tu du matériel, cartouches, livres... à vendre ?
Pierre.
J'en ai trouvé de pas trop cher sur ebay, mais frais de port élevé... je cherche.
As tu lu mon message sur le TI99 : as tu du matériel, cartouches, livres... à vendre ?
Pierre.
Re: [Exelvision] Synthèse vocale
Autre question :
trouve t-on le schéma du TI99 Speech Syntesizer pour le reproduire ? si bien sur il n'y a pas de composant "exotique".
trouve t-on le schéma du TI99 Speech Syntesizer pour le reproduire ? si bien sur il n'y a pas de composant "exotique".
Re: [Exelvision] Synthèse vocale
Super un projet sur la synthèse vocale des Exelvision et Ti99
La création des chaines LPC est une vrai galère avec le soft QBOX il n'a jamais donné un résultat de mon côté exploitable
Ca va apporter une grande aide pour ceux qui veulent programmer la synthèse vocale sur Exelvision
La création des chaines LPC est une vrai galère avec le soft QBOX il n'a jamais donné un résultat de mon côté exploitable
Ca va apporter une grande aide pour ceux qui veulent programmer la synthèse vocale sur Exelvision
Re: [Exelvision] Synthèse vocale
En 2012 j'ai fait un essai d'encodage avec QBOXPRO, qui donne ceci :
Comme l'a fait remarqué jester, une phrase n'est pas seulement un concaténation de mots isolés. Il y a une intonation, des liaisons, un rythme, et pleins de petits détails qui font la différence entre un robot et un être humain. C'est pourquoi un bon logiciel de génération de chaînes LPC serait plus utile qu'un dictionnaire de mots. Pour les bruitages, nous sommes au moins deux à avoir essayé et échoué avec QBOXPRO. Celui qui retrouvera les logiciels utilisés par TI à l'époque rendra un grand service à la communauté.Daniel
L'obstacle augmente mon ardeur.
L'obstacle augmente mon ardeur.
Re: [Exelvision] Synthèse vocale
Je viens tout juste de le lire, je vais y répondre.F1FCO a écrit :As tu lu mon message sur le TI99 : as tu du matériel, cartouches, livres... à vendre ?
Dernière modification par Fabrice Montupet le 27 sept. 2015 23:38, modifié 2 fois.
Re: [Exelvision] Synthèse vocale
Juste pour information sur les modules de synthèse vocale "modernes".
J'utilise pour des usages radio un module TextSpeak HD2.
On trouve ça ici : http://www.textspeak.com/tts_em.htm
Ça revient à plus de 400 €, mais ça énonce (presque) parfaitement une chaîne de caractère en français via une entrée série TTL.
Extrêmement utile pour répondre dans un certain contexte à des commandes passées par radio par DTMF.
Je n'ai rien trouvé d'équivalent à bon (faible) prix. Si quelqu'un en connait, je suis preneur de l'info.
C'était juste pour information, pas pour vous pousser à la dépense, et totalement hors sujet des machines et composants "vintage".
J'ai aussi joué avec un SPO256-AL2 et ses phonèmes. Ça parle bien anglais avec une voix de robot... et pour pas cher.
Pierre.
J'utilise pour des usages radio un module TextSpeak HD2.
On trouve ça ici : http://www.textspeak.com/tts_em.htm
Ça revient à plus de 400 €, mais ça énonce (presque) parfaitement une chaîne de caractère en français via une entrée série TTL.
Extrêmement utile pour répondre dans un certain contexte à des commandes passées par radio par DTMF.
Je n'ai rien trouvé d'équivalent à bon (faible) prix. Si quelqu'un en connait, je suis preneur de l'info.
C'était juste pour information, pas pour vous pousser à la dépense, et totalement hors sujet des machines et composants "vintage".
J'ai aussi joué avec un SPO256-AL2 et ses phonèmes. Ça parle bien anglais avec une voix de robot... et pour pas cher.
Pierre.
Re: [Exelvision] Synthèse vocale
Celui qui trouve aura mes plus chaleureux remerciements et mes félicitations.Daniel a écrit : Celui qui retrouvera les logiciels utilisés par TI à l'époque rendra un grand service à la communauté.
Je cherche depuis une vingtaine d'années sans succès hélas. Pour information, Texas Instruments utilisait un logiciel de génération de chaines LPC conçu par ses propres ingénieurs. L'outil tournait sur un mini ordinateur VAX installé dans leurs locaux de Lubbock (Dallas). Reste à trouver où est passé ce VAX et son armoire de stockage.
Re: [Exelvision] Synthèse vocale
Merci Daniel de montrer avec ton exemple les capacités du TMS5220 qui n'est pas un vulgaire pseudo synthé vocal comme on en trouvait à l'époque: juste capable de rejouer des phonèmes dans une liste fixe.
Il peut encoder des voix parlées ou chantées en conservant le timbre d'origine et une grande partie de la vie/dynamisme/particularité du locuteur.
Il peut aussi encoder des bruitages dans une certaine mesure... il peut le faire mais l'outil Qbox est orienté voix, donc les limites sont la. A noter qu'un bruit d'animal va se transformer en un bruit fait par un humain... très drôle !
Il peut aussi encoder des sons musicaux simples sur qqs octaves (un synthé basé sur le TMS5220 a existé sous la forme d'un petit programme Exelvision).
On a jamais pu encoder de musique complexe et je pense que c'est impossible.
Donc si ces projets Arduino permettent de comprendre comment programmer/générer une chaine LPC pour le 5220 c'est super, si c'est pour entendre "BOOOnn..Jouur... UUn.. Deuuux.... Troisss"
Ayant possédé un Exlevision à l'époque, ayant appris à le programmer vraiment aujourd’hui et à faire des démos/jeux, je peux vous dire qu'un synthé vocal ne sert à rien du tout... mais alors à rien du tout... à part si on peut l'exploiter pour compresser à mort et rejouer des bruitages et voix off. De plus dans l'architecture Exelvision, jouer une chaine LPC coute à peine 5% de CPU... à la différence des autres plateformes où la génération de sample est très couteuse en temps CPU.
Il y a des gens expert en image ici, mais personne qui touche sa bille en traitement du signal orienté audio me semble-t'il... sinon qu'il se dénonce !
Pour les oscillateurs je ne sais pas, mais le CPU ne fait qu'envoyer les portions de chaines LPC au 5220 pour remplir son buffer au fur et à mesure... aucun autre pilotage.
Il peut encoder des voix parlées ou chantées en conservant le timbre d'origine et une grande partie de la vie/dynamisme/particularité du locuteur.
Il peut aussi encoder des bruitages dans une certaine mesure... il peut le faire mais l'outil Qbox est orienté voix, donc les limites sont la. A noter qu'un bruit d'animal va se transformer en un bruit fait par un humain... très drôle !
Il peut aussi encoder des sons musicaux simples sur qqs octaves (un synthé basé sur le TMS5220 a existé sous la forme d'un petit programme Exelvision).
On a jamais pu encoder de musique complexe et je pense que c'est impossible.
Donc si ces projets Arduino permettent de comprendre comment programmer/générer une chaine LPC pour le 5220 c'est super, si c'est pour entendre "BOOOnn..Jouur... UUn.. Deuuux.... Troisss"
Ayant possédé un Exlevision à l'époque, ayant appris à le programmer vraiment aujourd’hui et à faire des démos/jeux, je peux vous dire qu'un synthé vocal ne sert à rien du tout... mais alors à rien du tout... à part si on peut l'exploiter pour compresser à mort et rejouer des bruitages et voix off. De plus dans l'architecture Exelvision, jouer une chaine LPC coute à peine 5% de CPU... à la différence des autres plateformes où la génération de sample est très couteuse en temps CPU.
Il y a des gens expert en image ici, mais personne qui touche sa bille en traitement du signal orienté audio me semble-t'il... sinon qu'il se dénonce !
Pour les oscillateurs je ne sais pas, mais le CPU ne fait qu'envoyer les portions de chaines LPC au 5220 pour remplir son buffer au fur et à mesure... aucun autre pilotage.
Re: [Exelvision] Synthèse vocale
Sur un TMS, probablement ; mais depuis plus de 30 ans, on peut le faire sur des puces de synthèse musicale commandées en Midi, et c'est très peu gourmand en mémoire...jester a écrit : On a jamais pu encoder de musique complexe et je pense que c'est impossible.
Dans les ordinosaures, il y a notamment le Yamaha (MSX) CX5M équipé d'un module de synthèse FM SFG-01 ou 05...
Notator est le nom d'un programme séquenceur Midi et notation musicale pour Atari ST(e) (puis Mac).
Re: [Exelvision] Synthèse vocale
Merci mais on est au courant pour la synthèse FM et la multitude de chip son qui ont vu le jour depuis 30ans !
La musique on s'en tape un peu pour le TMS5220, ce n'est pas la finalité.
La musique on s'en tape un peu pour le TMS5220, ce n'est pas la finalité.