[TMS5220] Y-a-t'il des matheux dans la salle ?

Cette catégorie traite de développements récents pour nos vieilles machines, applications, jeux ou démos... Amis programmeurs, c'est ici que vous pourrez enfin devenir célèbres!

Modérateurs : Papy.G, fneck, Carl

Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: [TMS5220] Y-a-t'il des matheux dans la salle ?

Message par Daniel »

Pour tester, j'utilise ce fichier binaire (raw) 8000Hz 16bits mono : http://dcexel.free.fr/tmp/mental.zip
Daniel
L'obstacle augmente mon ardeur.
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: [TMS5220] Y-a-t'il des matheux dans la salle ?

Message par Daniel »

Pour vérifier le résultat de l'analyse par Unianal, j'ai compilé le programme Unisynt permettant de jouer la chaîne LPC. J'ai découvert et corrigé un petit bug d'Unianal : le mode d'ouverture des fichiers binaires doit être précisé dans Windows (il est binaire par défaut dans Linux, mais pas dans Windows). Voici les versions correctes d'unianal et unisynt : http://dcexel.free.fr/tmp/unianal.zip

Avec les paramètres par défaut, on obtient un résultat encourageant avec le fichier http://dcexel.free.fr/tmp/mental.l16
Il manque les deux dernières phrases, mais la partie décodée est audible : http://dcexel.free.fr/tmp/mental.syn.wav

Reste maintenant à affiner les paramètres, en particulier la largeur de la fenêtre d'analyse à adapter à la longueur de chaque phrase. Ensuite il faudra reconstituer une chaîne LPC pour le 5220...
Daniel
L'obstacle augmente mon ardeur.
jester
Messages : 2328
Inscription : 01 janv. 2009 23:16
Localisation : Grenoble

Re: [TMS5220] Y-a-t'il des matheux dans la salle ?

Message par jester »

Daniel a écrit :Ensuite il faudra reconstituer une chaîne LPC pour le 5220...
C'est un peu cette partie qui m'inquiète, je n'ai pas compris comment préciser les coefficients et différents paramètres spécifiques au TMS5220 version Exelvision... sans parler de la sortie du programme où je n'ai rien capté !
Le résultat est moins bon que celui généré avec Qbox me semble-t-il, mais c'est encourageant.
Cependant ce genre d'outil est encore et encore dédié à la synthèse de la parole... le truc vraiment intéressant serait de pouvoir encoder des bruitages ! L'algo ici présent est étudié pour la parole et ne semble pas adaptable à autre chose.
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: [TMS5220] Y-a-t'il des matheux dans la salle ?

Message par Daniel »

Ce que j'ai compris des fichiers de sortie : L'énergie, le pitch et les coefficients de réflexion sont dans des fichiers séparés, sous forme de "short integers" ou de tableaux de "float" (pour les coefficients de réflexion). Normalement il doit y avoir une énergie, un pitch et dix coefficients de réflexion par trame générée.

Il faut d'abord coder toutes ces données en fonction des tables du 5220 : pour chaque donnée, trouver la valeur la plus approchante dans la table du 5220 et prendre son code. Quand on a tous les codes, on peut alors générer la chaîne LPC.

Après, il y a beaucoup de paramètres à régler dans Unianal. Je pense qu'on doit pouvoir améliorer la qualité de la synthèse. Et l'auteur dit clairement que le player Unisynt est très imparfait : on aura peut-être une bonne surprise sur le vrai matériel.

Je reconnais que ce n'est pas évident. QBOXPRO est presque facile à utiliser par rapport à Unianal. Mais on a les sources, on peut les compiler dans Windows, les modifier, ajouter une interface graphique, etc. Ca fait une grosse différence.
Daniel
L'obstacle augmente mon ardeur.
jester
Messages : 2328
Inscription : 01 janv. 2009 23:16
Localisation : Grenoble

Re: [TMS5220] Y-a-t'il des matheux dans la salle ?

Message par jester »

Oui c'est clairement une super base de travail pour construire un outil moderne pour gérer les chaines LPC !
Répondre