< Back to IRCAM Forum

Récupérer les informations de segmentation

Bonjour,

Est-il possible d’avoir quelques détails sur les informations générées par OMax (avec la boîte save) et notamment ce qui se trouve dans le fichier Forum_SP.json généré lors de l’enregistrement. Les données se présentent sous cette forme :

“state” : 0,

“time” : [ 0, 0 ],

“seg” : [ 0, 0 ],

“pitch” : 60,

“coeffs” : [ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 ]

J’imagine qu’il s’agit des données de segmentation spectrale. A quoi correspondent ces 5 groupes de valeurs et quelles sont les unités (notamment pour “time”)

Pierre Couprie

 

Bonjour Pierre,

Effectivement, ces données sont les données de segmentation spectrale. Le premier état (qui est celui que tu as copié) n’a pas de réel sens, c’est seulement l’initialisation. Mais pour les suivants :

“state” est le numéro d’état (dans la structure de donnée)

“time” est en milliseconde : [date de début, date de fin]

“seg” est la segmentation de plus haut niveau : [numéro de section, numéro de phrase]

“pitch” est une info additionnelle de pitch (format MIDI)

“coeffs” est le vecteur de 10 coefficients MFCCs

Voilà, n’hésites pas à me demander d’autres précisions si besoin !

Bon OMax :slight_smile:

Merci beaucoup, c’est parfait

Pierre