< Back to IRCAM Forum

Remnant — sound traces from a non-human world

A Brownian timbral composition system with real-time Lerdahl masking


Remnant is a multichannel acousmatic composition and live electronics system for orchestra and 8-channel diffusion. The system integrates a perceptual timbral space (McAdams), a quantitative tension model (Lerdahl), and stochastic navigation (Brownian motion) into a unified compositional and performance environment.


Theoretical framework

The system is grounded in two complementary theoretical models that operate at different temporal scales.

McAdams’ timbral prolongational hierarchy treats timbre as a structural force analogous to harmony in tonal music. Sounds are positioned in a perceptual space defined by spectral and temporal descriptors — brightness, roughness, attack time, spectral flux — weighted according to their perceptual salience. Proximity within this space creates timbral coherence; distance generates tension. The hierarchy describes how timbral events prolong, destabilise and resolve, providing a structural grammar for spectrally-defined, non-pitched music.

Lerdahl’s timbral tension model extends this framework into a quantitative metric: tension is a function of distance within the timbral space, modulated by the hierarchical position of each event within the prolongational structure. In Remnant, this value governs the real-time processing layer directly — at low tension the orchestral source remains recognisable; as tension increases, it is progressively masked, displaced and rendered unrecognisable within an artificial acoustic environment.

The two models articulate different aspects of temporal organisation: McAdams structures the compositional trajectory at the macro level (selection, ordering and density of timbral events across the full duration); Lerdahl governs the micro level (the degree of transformation applied to each event in real time).


Compositional system

The timbral space is constructed from the ConTimbre corpus of orchestral extended techniques, mapped via UMAP with McAdams perceptual feature weights (spectral centroid, brightness, roughness, attack time, spectral flux). Navigation through this space follows Brownian motion with a directional attractor derived from Thoresen’s Dynamic Forms (Aural Sonology): Forward, Backward, Presence, Neutral. Each direction defines a different attractor geometry, shaping the stochastic path toward specific regions of the timbral space.

Multiple simultaneous fields (up to 15) traverse the space independently, with inter-field exclusion guaranteeing that no sound appears in more than one field. The resulting gesture sequence is encoded as a JSON score (brownian_score.json) that drives both the ePlayer (Reaper) for orchestral material and the SuperCollider processing chain.

The graphic score visualises each field on an azimuthal axis (0–360°, mapped to 8-channel octophonic diffusion), with proportional pulse grid notation derived from the Brownian inter-step distances as binary rational fractions.


Processing architecture

The signal chain implements the Lerdahl tension model as a four-stage masking pipeline in SuperCollider:

Orchestra → BlackHole → SoundIn (4 fields)
    → PitchShift    (melodic/timbral scrambling, scales with tension)
    → Convolution2  (procedural IR per Lachenmann category)
    → FreqShift     (spectral rotation, breaks residual harmonic structure)
    → BPF           (moving spectral window toward inharmonic frequencies)
    → 8-channel octophonic output

The dry signal is attenuated by (1 − tension)^1.5 — not mixed additively with the wet signal. At tension 1.0 the source is zero; what remains is entirely the processed, displaced material.

Impulse responses are generated procedurally in SuperCollider, one per Lachenmann timbral category:

Category IR character Max freq shift BPF Q
Klang Pure harmonic partials, long decay 15 Hz 0.3
Farbklang Inharmonic ratios (φ, √2, √3…) 60 Hz 0.5
Geräusch Broadband + band-filtered noise 180 Hz 1.2
Kadenz Periodic impulse train 8 Hz 2.0
Textur Slow FM modulation 25 Hz 0.2
Stille Near-impulse, maximum transparency 0 Hz 0.1
Neutro Neutral resonance 5 Hz 0.3

All fields share the same IR and tension value, treating the orchestra as a single timbral body. Azimuth is per-field from the score.


Real-time analysis

FluCoMa provides a parallel analysis layer via FluidMFCC, FluidOnsetSlice and FluidNoveltySlice. The output is a continuous tension estimate (~r_flucoTension) that modulates the processing pipeline with a maximum contribution of 0.4 on top of the score-defined tension:

T_final = clip(T_score + T_FluCoMa × 0.4, 0, 1)

Where the analytical tension and the compositional trajectory converge, the processing is coherent with the score. Where they diverge, the stochastic geometry and the live orchestral material pull in opposite directions — a controlled instability that is central to the compositional concept.


Performance

In concert, the performer controls timbral category and tension manually in real time, responding to the orchestra rather than following a pre-determined timeline. The HUD provides direct access to seven Lachenmann category buttons, a tension slider, and real-time display of both compositional and analytical tension streams simultaneously.


Repository

github.com/naiv40/Remnant



Un système de composition timbrale brownienne avec masquage de Lerdahl en temps réel


Remnant est une composition acousmatique multicanal et un système d’électronique en direct pour orchestre et diffusion octophonique. Le système intègre un espace timbral perceptif (McAdams), un modèle de tension quantitatif (Lerdahl), et une navigation stochastique (mouvement brownien) dans un environnement compositionnel et performatif unifié.


Cadre théorique

Le système repose sur deux modèles théoriques complémentaires qui opèrent à des échelles temporelles différentes.

La hiérarchie prolongationnelle timbrale de McAdams traite le timbre comme une force structurelle analogue à l’harmonie dans la musique tonale. Les sons sont positionnés dans un espace perceptif défini par des descripteurs spectraux et temporels — brillance, rugosité, temps d’attaque, flux spectral — pondérés selon leur saillance perceptive. La proximité au sein de cet espace crée une cohérence timbrale ; la distance génère de la tension. La hiérarchie décrit comment les événements timbraux prolongent, déstabilisent et résolvent, fournissant une grammaire structurelle pour une musique définie spectralement, sans hauteur fixe.

Le modèle de tension timbrale de Lerdahl étend ce cadre en une métrique quantitative : la tension est fonction de la distance dans l’espace timbral, modulée par la position hiérarchique de chaque événement au sein de la structure prolongationnelle. Dans Remnant, cette valeur gouverne directement la couche de traitement en temps réel — à faible tension, la source orchestrale reste reconnaissable ; à mesure que la tension augmente, elle est progressivement masquée, déplacée et rendue méconnaissable dans un environnement acoustique artificiel.

Les deux modèles articulent des aspects différents de l’organisation temporelle : McAdams structure la trajectoire compositionnelle au niveau macro (sélection, ordonnancement et densité des événements timbraux sur toute la durée) ; Lerdahl gouverne le niveau micro (le degré de transformation appliqué à chaque événement en temps réel).


Système compositionnel

L’espace timbral est construit à partir du corpus ConTimbre de techniques étendues orchestrales, cartographié via UMAP avec les poids perceptifs de McAdams (centroïde spectral, brillance, rugosité, temps d’attaque, flux spectral). La navigation dans cet espace suit un mouvement brownien avec un attracteur directionnel dérivé des Formes Dynamiques de Thoresen (Aural Sonology) : Forward, Backward, Presence, Neutral. Chaque direction définit une géométrie d’attracteur différente, orientant le parcours stochastique vers des régions spécifiques de l’espace timbral.

Plusieurs champs simultanés (jusqu’à 15) traversent l’espace indépendamment, avec une exclusion inter-champs garantissant qu’aucun son n’apparaît dans plus d’un champ. La séquence gestuelle résultante est encodée sous forme de partition JSON (brownian_score.json) qui pilote à la fois l’ePlayer (Reaper) pour le matériau orchestral et la chaîne de traitement SuperCollider.

La partition graphique visualise chaque champ sur un axe azimutal (0–360°, mappé sur une diffusion octophonique 8 canaux), avec une notation proportionnelle de grille pulsée dérivée des distances inter-pas browniennes sous forme de fractions rationnelles binaires.


Architecture de traitement

La chaîne de signal implémente le modèle de tension de Lerdahl comme un pipeline de masquage à quatre étages dans SuperCollider :

Orchestre → BlackHole → SoundIn (4 champs)
    → PitchShift    (scrambling mélodique/timbral, échelle avec la tension)
    → Convolution2  (RI procédurale par catégorie Lachenmann)
    → FreqShift     (rotation spectrale, brise la structure harmonique résiduelle)
    → BPF           (fenêtre spectrale mobile vers les fréquences inharmoniques)
    → sortie octophonique 8 canaux

Le signal sec est atténué par (1 − tension)^1.5 — non mélangé additivement avec le signal humide. À tension 1.0, la source est nulle ; ce qui subsiste est entièrement le matériau traité et déplacé.

Les réponses impulsionnelles sont générées de manière procédurale dans SuperCollider, une par catégorie timbrale de Lachenmann (Klang, Farbklang, Geräusch, Kadenz, Textur, Stille, Neutro).


Analyse en temps réel

FluCoMa fournit une couche d’analyse parallèle via FluidMFCC, FluidOnsetSlice et FluidNoveltySlice. La sortie est une estimation continue de la tension (~r_flucoTension) qui module le pipeline de traitement avec une contribution maximale de 0.4 au-dessus de la tension définie par la partition :

T_final = clip(T_partition + T_FluCoMa × 0.4, 0, 1)

Là où la tension analytique et la trajectoire compositionnelle convergent, le traitement est cohérent avec la partition. Là où elles divergent, la géométrie stochastique et le matériau orchestral en direct tirent dans des directions opposées — une instabilité contrôlée qui est centrale au concept compositionnel.


Performance

En concert, l’interprète contrôle manuellement la catégorie timbrale et la tension en temps réel, en répondant à l’orchestre plutôt qu’en suivant une chronologie prédéterminée. Le HUD offre un accès direct à sept boutons de catégorie Lachenmann, un curseur de tension, et l’affichage en temps réel des deux flux de tension — compositionnel et analytique — simultanément.


Dépôt

github.com/naiv40/Remnant