Cos’è la musica? Per molti “musica” può significare soltanto i grandi maestri: Beethoven, Debussy e Mozart. Per altri è Busta Rhymes, Dr. Dre e Moby. Per uno dei miei insegnanti di sassofono al Berklee College of Music — e per schiere di appassionati di “jazz tradizionale” — tutto quel che è anteriore al 1940 o posteriore al 1960 non è vera musica. Quand’ero ragazzino, negli anni Sessanta, avevo degli amici che venivano a trovarmi per ascoltare i Monkees, perché a casa loro era permessa solo la musica classica e, a qualcuno, solo i canti religiosi: il rock’n’roll e i suoi “ritmi pericolosi” facevano paura. Quando, nel 1965, Bob Dylan osò suonare una chitarra elettrica al Newport Folk Festival, parte del pubblico se ne andò e chi rimase lo sommerse di fischi. La Chiesa cattolica bandì la musica che conteneva polifonia (due o più linee melodiche suonate insieme), temendo che potesse indurre i fedeli a dubitare dell’unità divina. La Chiesa bandì anche l’intervallo di quarta eccedente, cioè la distanza tra il Do e il Fa diesis, detto anche “tritono” (l’intervallo in West Side Story di Leonard Bernstein quando Tony canta il nome “Maria”). Quest’intervallo era considerato talmente dissonante che doveva essere per forza opera di Lucifero e così la Chiesa lo definì Diabolus in musica. Fu il pitch a far insorgere la Chiesa medievale. E fu il timbro a far fischiare Dylan. Furono i ritmi africani latenti nel rock a spaventare i genitori della provincia americana, forse preoccupati all’idea che potessero indurre una trance permanente nei loro innocenti pargoli. Cosa sono ritmo, pitch e timbro? Solo un modo di descrivere gli aspetti meccanici di una canzone, oppure hanno un fondamento più profondo, neurologico? Sono tutti elementi necessari?
L’opera di compositori dell’avanguardia come Francis Dhomont, Robert Normandaeu o Pierre Schaeffer allarga i confini di quel che la maggior parte di noi pensa sia la musica. Lasciandosi alle spalle l’uso della melodia e dell’armonia, e persino degli strumenti, questi compositori usano le registrazioni di oggetti qualsiasi, come martelli pneumatici, treni e cascate. Montano le registrazioni, giocano con i loro pitch e infine le combinano in un collage organizzato di suoni che ha lo stesso tipo di traiettoria emotiva – tensione e rilassamento – della musica tradizionale. I compositori di questa tradizione sono come i pittori che oltrepassarono i confini dell’arte rappresentativa: cubisti, dadaisti, molti pittori moderni da Picasso a Kandinsky e Mondrian.
Cos’ha in comune la musica di Bach, dei Depeche Mode e di John Cage? A livello più elementare, cosa differenzia What’s It Gonna Be?! di Busta Rhymes o la Patetica di Beethoven, ad esempio, dall’insieme di suoni che potreste sentire stando al centro di Times Square o nel cuore di una foresta pluviale? Come recita la famosa definizione del compositore Edgard Varèse: «La musica è suono organizzato».
***
le componenti elementari della musica. Quali sono? E, quando organizzate, come danno origine alla musica? Gli elementi fondamentali di ogni suono sono: intensità, pitch, profilo melodico, durata (o ritmo), tempo, timbro, posizione spaziale e riverbero. I nostri cervelli organizzano questi attributi percettivi fondamentali in concetti di livello superiore – proprio come un pittore organizza le righe in forme – che includono metro, armonia e melodia. Quando ascoltiamo della musica, stiamo in realtà percependo più attributi o “dimensioni”.
***
pitch: la qualità che fondamentalmente distingue il suono associato a un certo tasto del pianoforte rispetto a un altro.
***
Ritmo, metro e tempo sono concetti correlati che spesso vengono confusi tra loro. In sintesi, il ritmo si riferisce alla lunghezza delle note, il tempo all'”andamento” di un pezzo musicale (la velocità con cui battereste il piede) e il metro a quando battete il piede forte e piano e come questi battiti forti e leggeri si riuniscano a formare unità più grandi.
***
Il timpano è semplicemente una membrana tesa tra tessuto e osso. È la porta d’ingresso dell’udito. Di fatto tutte le nostre impressioni sul mondo sonoro derivano dal modo in cui il timpano vibra avanti e indietro in risposta alle molecole che lo colpiscono (entro certi limiti, anche i padiglioni auricolari – la parte carnosa del nostro orecchio – sono coinvolti nella percezione uditiva, così come le ossa del cranio; ma per lo più è il timpano la fonte principale delle nostre informazioni sul mondo sonoro esterno). Consideriamo una tipica scena uditiva: una persona che legge un libro in salotto. Supponiamo che in questo ambiente ci siano sei sorgenti sonore che il soggetto può prontamente identificare: il sibilo dell’impianto di riscaldamento (la ventola che muove l’aria attraverso le condutture), il ronzio del frigorifero in cucina, il traffico in strada (che a sua volta potrebbe esser costituito da dozzine di suoni diversi, tra cui i vari motori, lo stridio di freni, i clacson, ecc.), il fruscio delle foglie mosse dal vento, un gatto che fa le fusa nella poltrona accanto e la registrazione dei preludi di Debussy. Ognuno di questi rumori può essere considerato un oggetto uditivo o una sorgente sonora, e siamo capaci di identificarli perché ciascuno ha un suo suono caratteristico.
Il suono viene trasmesso attraverso l’aria dalle molecole che vibrano a certe frequenze. Queste molecole bombardano il timpano, facendolo muovere avanti e indietro a seconda della forza con cui lo colpiscono (in base al volume o all’ampiezza del suono) e alla velocità con cui vibrano (in base al pitch). Ma nelle molecole non c’è nulla che dica al timpano da dove esse arrivino o a quali oggetti siano associate. Le molecole messe in moto dal gatto che fa le fusa non trasportano alcun dato identificativo che dica “gatto”, e possono arrivare al timpano nello stesso tempo e nella stessa regione timpanica dei rumori del frigorifero, del riscaldamento, di Debussy e di tutto il resto.
Immaginate di tendere una federa sull’imboccatura di un secchio, e che varie persone lancino palline da ping-pong da diverse distanze; ognuna può tirare tutte le palline e tutte le volte che vuole. Il vostro compito è di capire, solo guardando come si muove la federa, quante persone ci sono, chi sono e se si stiano avvicinando, allontanando o se siano ferme. Questo vi dà un’idea di quel con cui deve combattere il sistema uditivo per identificare gli oggetti sonori nel mondo, usando come guida solo il movimento del timpano. Come fa il cervello a capire, da questo disorganizzato miscuglio di molecole che sbattono contro una membrana, cosa c’è là fuori? In particolare, come ci riesce nel caso della musica?
Ce la fa grazie a un processo di “estrazione delle caratteristiche”, seguito da uno di integrazione delle stesse. Il cervello estrae dalla musica le caratteristiche essenziali, usando delle reti neurali specializzate che scompongono il segnale in informazioni su pitch, timbro, posizione spaziale, intensità, ambiente riverberante, durata dei toni e tempi di attacco delle diverse note (e delle diverse componenti dei toni). Queste operazioni sono svolte in parallelo da circuiti neurali che computano questi valori e che possono operare con una certa indipendenza l’uno dall’altro: in altre parole, per fare i suoi calcoli il circuito del pitch non deve attendere che quello della durata sia completo. Questo tipo di elaborazione – in cui solo le informazioni contenute nello stimolo vengono prese in considerazione dai circuiti neurali – è detta “elaborazione bottom-up”. Nel mondo e nel cervello questi attributi della musica sono separabili. Possiamo cambiarne uno senza modificare gli altri, proprio come possiamo mutare la forma degli oggetti visivi senza alterarne il colore.