Bonjour,
Nous travaillons actuellement sur des méthodes de représentation et transformation de la voix avec des réseaux profonds qui - si la qualité sera suffisamment bien - sera être intégré dans ISiS dans un horizon de 1 - 2 ans. Nous sommes actuellement en train de collecter des évaluations, notamment par des gens avec des bonnes oreilles, pour voir entre autre comment la méthode se compare aux méthodes présentent dans ISiS.
Nous vous serions très reconnaissante si vous pourriez faire un ou plusieurs des testes suivantes.
Les résultats vont être utilisé pour alimenter une publication qui doit être soumis mercredi le 6. octobre.
Si vous auriez envie de nous aider ce serait mieux avant. Ici la liste des testes disponibles
1 Synthèse de la Parole a partir du spectrogramme Mel
http://recherche.ircam.fr/anasyn/roebel/test_NeuralVocoder/index.php?name=Speech
Vous devez écouter des enregistrements de voix parler de qq secondes et qq re-synthèses de ces enregistrements et par la suite évaluer à sur une échelle de 0 à 100 la similarité entre originale et la re-synthèse.
Durée ~ 4-5min
Vous pouvez répéter le test, les exemples sont tiré aléatoirement d’un réservoir
2 Synthèse du chant a partir du spectrogramme Mel
http://recherche.ircam.fr/anasyn/roebel/test_NeuralVocoder/index.php?name=Singing
Même programme que sous 1) mais avec la voix chanté.
Durée ~ 6-7min
Vous pouvez répéter le test, les exemples sont tiré aléatoirement d’un réservoir
3) Transposition du chant par modification du spectrogramme Mel
http://recherche.ircam.fr/anasyn/bous/pitch_transformations/singing/
Ici vous devez écouter des enregistrements de chant modifié (transposition) et par la suite évaluer
la qualité du son. Donc la question a quelle point vous pourriez imaginé que le son écouté soit une enregistrement d’une voix réelle
Durée ~ 10min
Vous pouvez répéter le test, les exemples sont tiré aléatoirement d’un réservoir
Merci