La musique de jeu vidéo : histoire, principes et enjeux

Un bref historique

La musique de jeu vidéo a été et est toujours, dans une certaine mesure, tributaire des moyens technologiques. Si dans les années 1970, des créateurs s’étaient offerts les services d’un orchestre, il aurait été impossible aux dispositifs d’autrefois de réussir à retransmettre l’enregistrement, car il n’y avait pas encore d’enregistrement possible sur un support numérique. Il a donc fallu trouver une solution pour pallier à ce problème et permettre aux joueurs de bénéficier d’un accompagnement musical.

Durant les années 1970, les compositeurs, qui sont surtout des programmeurs, vont utiliser au mieux les sons qu’il est possible d’émettre à partir de puces électroniques spécifiques, présentes dans les dispositifs. Dans le cas d’une borne d’arcade, la puce électronique convertit le signal électrique en son analogique qui est directement diffusé par les haut-parleurs. Ces sons sont tout d’abord utilisés pour enrichir l’expérience de jeu de quelques « bip » et autres effets sonores rudimentaires, signalant l’accomplissement d’une action ou le début d’une partie. Les puces ne pouvant émettre qu’un son à la fois, puis ensuite deux, les possibilités musicales sont extrêmement limitées. Au départ des quelques notes d’un Gun Fight (1975) citant la Marche funèbre de Chopin lors de la mort d’un personnage, les premiers jingles apparaissent, comme ceux de Pac-Man (1980) ou de Donkey Kong (1981).

Au début des années 1980, le nombre de canaux sonores augmente. La Famicom (1983) en possède cinq, chacun d’eux étant monophoniques, c’est-à-dire qu’ils ne peuvent émettre qu’un son à la fois. Les deux premiers produisent une onde sonore de type square et sont destinés à la mélodie ; le troisième produit une onde de type triangle qui convient très bien pour la basse ; le quatrième produit du bruit blanc (noise) et est utilisé pour le rythme ; le dernier permet la diffusion de courts échantillons sonores, nommés samples en anglais.

Avec cette configuration, les compositeurs écrivent des morceaux essentiellement mélodiques, flanqués d’un accompagnement de basse et de batterie. Malgré ces contraintes, certains compositeurs réussissent à écrire des thèmes qui sont littéralement restés gravés dans les esprits. C’est à cette époque que les premiers fondements de la musique de jeu vidéo sont posés et que des noms émergent, comme ceux de Kōji Kondō ou de Nobuo Uematsu au Japon.

Le premier fondement est celui de la boucle musicale, loop en anglais. L’accomplissement d’un niveau ou d’un passage spécifique dans un jeu variant d’un joueur à l’autre en terme de temps, opter pour une boucle musicale qui peut se répéter indéfiniment est une solution logique. Contraindre un compositeur à écrire une musique continue de plusieurs minutes pour chacune des pistes d’un jeu aurait nécessité beaucoup plus de temps pour l’écriture d’une bande originale, là où un thème accrocheur d’une minute fonctionne tout aussi bien et est plus léger en terme de kilooctets. La boucle musicale nécessite un thème agréable qui ne lassera pas le joueur après quelques écoutes. À l’ère de la musique 8-bit, les compositeurs qui sortent du lot sont de bons mélodistes, car écrire des thèmes de qualité est indispensable. À ce titre, le nom de Kōji Kondō est l’un des plus signifiants, puisqu’il a fourni coup sur coup la musique de deux piliers du jeu vidéo : Super Mario Bros. (1985) et The Legend of Zelda (1986).

Le second fondement de la musique de jeu vidéo est l’interactivité. Le joueur étant acteur, il est indispensable d’insérer un dialogue entre lui et le jeu, déclenché par les actions du personnage ou par l’environnement. Dans Super Mario Bros., la récolte d’une pièce émet un son. Or, sur la Famicom/NES, la musique et les bruitages se partagent les canaux sonores pour une raison technique, celle de leur nombre limité à cinq. Une difficulté supplémentaire s’ajoute : les bruitages doivent se synchroniser à l’action du joueur, sans que la musique n’en pâtisse. La solution est de supprimer le son émis par un canal le temps du bruitage.

Dans cet extrait, lorsque Mario récolte plusieurs pièces d’affilé, nous n’entendons plus que l’accompagnement basse/batterie. Les bruitages s’imbriquent dans la musique tout en signalant l’accomplissement d’actions au joueur. Il existe aussi des interactions entraînant des changements musicaux. Lorsque Mario prend une étoile et devient invulnérable, le personnage clignote et la musique change. Dans un autre registre, lorsque le compte-à-rebours passe sous un certain nombre, un petit jingle suivi du thème principal, repris à un tempo plus élevé, notifie au joueur qu’il est temps de se rendre à la fin du niveau. Ces quelques modifications musicales rudimentaires vont être à la base d’un enjeu propre à la musique de jeu vidéo, celui de l’interactivité.

A partir de 1984, les artistes ont accès à la synthèse FM. Il s’agit d’une synthèse sonore basée sur la modulation de fréquences. Toutefois, cela ne fut accessible sur les consoles de salon en Occident qu’à partir de la génération 16-bit. Sortie en 1988 au Japon et en 1990 en Europe, la Mega Drive possède dix canaux sonores, la stéréo et une meilleure qualité sonore que la génération 8-bit. Elle embarque à son bord deux puces sonores. La première est la Yamaha YM2612 qui génère six voix FM. La seconde est la Texas Instruments SN76489 qui génère quatre voix non FM : trois voix square et une noise. Pour faire simple, la première puce prend en charge la musique et la seconde les bruitages et les éléments musicaux additionnels. Désormais, la musique ne sera plus tronquée pour faire entendre les bruitages.

De son côté, la Super Famicom (1990) utilise une puce de huit canaux utilisant des samples 16-bit, le tout en stéréo. Elle peut aussi produire des effets sonores tels que la réverbération. Ci-dessous, vous pouvez entendre Castle Theme de Super Mario World (1990) et le thème principal de Donkey Kong Country (1994). Le second extrait joue sur l’évolution musicale entre les générations 8-bit et 16-bit. La musique ne dévoile son vrai potentiel qu’après quelques secondes où elle fait référence à la musique d’introduction du portage de Donkey Kong sur Famicom en 1983. Ce contraste a pour effet de mettre en évidence la transition générationnelle.

Toutefois, une limitation technique reste de taille, celle de la mémoire, car chaque échantillon sonore pèse bien plus que quelques lignes de code synthétisées par des puces sonores. Avec l’apparition du CD comme support pour les jeux, ce problème est en grande partie réglé. En 1994, la PlayStation est équipée d’un lecteur CD-ROM et possède 24 canaux d’échantillons 16-bit à une fréquence atteignant la qualité d’un CD audio. A partir du support CD, il est possible à ceux qui s’en donnent les moyens de directement implanter des pistes avec des instruments acoustiques enregistrés, pouvant aller jusqu’à l’orchestre, ou préenregistré dans le cas d’instruments virtuels. Le premier jeu a faire appel à un véritable orchestre pour sa bande originale est Voyeur (1993) sur CD-i, dont la musique est de Garry Schyman, compositeur de la saga BioShock. Pour ce qui est des instruments virtuels, ils restent tributaires de l’impératif technologique, mais la qualité sonore de ceux-ci ne cessera de s’améliorer avec le temps. Depuis quelques années, il est tout à fait possible d’utiliser des banques sonores orchestrales d’un rendu convainquant. Ceci a le mérite de démocratiser l’accès à un semblant d’orchestre pour ceux qui ont de bonnes idées.

La musique d’écran, procédé hérité du cinéma

La musique de jeu vidéo est l’héritière de la musique de film. Elle est une musique à l’image, naturellement dépendante de son support et de l’œuvre qu’elle illustre. Dans les films et les jeux, le processus créatif est collectif et la musique est l’une des composantes, au même titre que la narration, la mise en scène… La musique a comme principal objectif d’accompagner l’image et d’en sublimer son contenu. En tant qu’héritière de la musique de film, la musique de jeu vidéo use de procédés développés dans le milieu du cinéma. La musique d’écran en fait partie. Il s’agit de la musique qui est entendue dans le monde fictionnel, à l’opposé du reste de la musique qui n’est entendue que par le spectateur ou le joueur et qui fait partie de la musique de fosse. Le plus souvent, la musique d’écran est intégrée à l’univers pour renforcer sa crédibilité, donner plus de corps, voire être utilisée, dans le cas du jeu vidéo, comme un élément de gameplay. C’est le cas lorsque le personnage joueur allume ou éteint une radio pour distraire un garde.

Retenez que la musique d’écran est une musique que les personnages de l’univers entendent comme le spectateur ou le joueur. Dans le cas de Rayman Origins (2011), ce procédé est utilisé comme point de départ de l’aventure. La musique produite par les actions des personnages agace la vieille dame du dessous qui va lancer une attaque contre eux afin de les capturer.

La musique interactive, procédé propre au jeu vidéo

La musique interactive, parfois appelée « musique dynamique », est au centre de réels enjeux spécifiques au jeu vidéo. Elle était déjà utilisée de manière rudimentaire durant les années 1980 (cfr. supra, Super Mario Bros.). En 1991, Monkey Island 2 : LeChuck’s Revenge bénéficie d’une musique interactive travaillée grâce au système interactive MUsic Streaming Engine (iMUSE) de Michael Land et Peter McConnell, qui sera réutilisé ultérieurement par LucasArts. Dans Monkey Island 2, les textures sonores changent sans interruption en fonction de l’environnement et des personnages rencontrés.

Ce changement sans interruption en fonction de l’état existe toujours. Des exemples récents se retrouvent dans des jeux comme Nier: Automata (2017) et Super Mario Odyssey (2017), où la musique passe dans un registre 8-bit en certaines circonstances.

Souvent, une musique interactive est composée de stems. Ce sont des pistes sonores indépendantes qui vont s’accorder, se succéder et s’additionner en fonction des actions du joueur pour former un morceau complet qui possède une grande élasticité. C’est le cas de Monkey Island 2. Un compositeur peut aussi avoir recours à des sections plus longues gravitant autour d’une idée générale dont elles ne sont que des déclinaisons en terme d’intensité, le tout ponctué de pistes indépendantes qui font des apparitions succinctes. C’est le cas de Doom (2016).

L’enjeu majeur que porte la musique interactive pose des questions importantes à l’heure où les orchestres et les concerts de musique de jeu vidéo se multiplient : comment rendre cette interactivité lorsqu’elle est l’élément primordiale d’une bande originale ? Ne perd-on pas une partie de l’expérience musicale en gommant cette composante ? Ceci sous-tend que, bien que les bandes originales sur CD ou en format digital existent, celles-ci sont une suite cohérente qui rend hommage au travail du compositeur, mais ce travail est amputé d’une composante parfois essentielle : celle du dialogue que la musique entretient avec le joueur. Nous participons à un voyage avec une bande originale ou lors d’un concert, mais nous n’avons plus d’emprise sur la musique au travers de nos actions. Le déroulement musical nous est imposé. De là, une question me semble importante : doit-on jouer à un jeu pour profiter au mieux de sa musique ? Et par extension : peut-on analyser ou critiquer la musique de jeu vidéo en la sortant de son contexte ? Des questions importantes sur lesquelles je reviendrai à l’avenir.

Entre parenthèse, une musique que l’on pourrait qualifier de « dynamique » existe déjà avant le jeu vidéo. Aux alentours de 1910, la Edison Film Company met au point un système de musique compilée pour accompagner ses propres films[1]. Lors d’une projection, l’accompagnateur puise dans ces compilations pour s’adapter au mieux au déroulement du film. Cela donne un accompagnement musical qui varie en fonction du musicien et de la projection. Toutefois, ceci ne se fait pas en fonction du spectateur mais de l’accompagnateur, différence essentielle avec le jeu vidéo.

La diversité des approches et l’éclectisme de genres

Bien que l’esthétique musicale puisse varier d’une bande originale à une autre, la musique de jeu vidéo répond de manière générale à certains codes propres au médium ou hérités du cinéma. Par exemple, les cuivres sont souvent utilisés dans les scènes d’action à caractère épique, les chœurs pour des scènes solennelles, la musique dissonante exprime l’angoisse et l’horreur, le piano accompagné d’un violon, d’un alto ou d’un violoncelle exprime la douceur, la fragilité et/ou la tristesse… Les compositeurs de musique de jeu vidéo se permettent de puiser à leur guise dans les formes, les procédés et les genres musicaux qui conviennent le mieux à l’image. Ils disposent de tous les moyens à leur disposition pour mettre en avant la narration et les émotions. La musique peut suivre l’image, elle est alors « empathique », ou s’y opposer, jouer sur le contraste et devenir « anempathique ». Un bon compositeur est un compositeur qui comprend quels sont les enjeux de l’œuvre qu’il met en musique et quels sont les outils dont il doit se servir pour les mettre en valeur, tout en ne reniant pas sa sensibilité artistique.

[1] MECHERI, Damien, Video Game Music, Histoire de la musique de jeu vidéo, Toulouse, éditions Pix’n Love, 2014, p. 9.

Sources

MECHERI, Damien, Video Game Music, Histoire de la musique de jeu vidéo, Toulouse, éditions Pix’n Love, 2014.

La Nintendo NES [en ligne, réf. du 25 novembre 2018], disponible sur http://mo5.com/musee-machines-nes.html

La Nintendo Super Nintendo [en ligne, réf. du 25 novembre 2018], disponible sur http://mo5.com/musee-machines-snes.html

La Sega Megadrive [en ligne, réf. du 25 novembre 2018], disponible sur http://mo5.com/musee-machines-megadrive.html

La Sony Playstation [en ligne, réf. du 25 novembre 2018], disponible sur http://mo5.com/musee-machines-psx.html

Un commentaire

  1. Tour d’horizon compact sur le sujet, une sorte de porte d’entrée aux contenus à venir dans des futurs articles. Dès lors difficile de rebondir tant l’article ouvrent de nombreuses portes… Cela manque peut-être un peu de références aux productions européennes où là aussi de nombreux compositeurs programmeurs ont exploité à merveilles les performances sonores plus ou moins modestes des appareils de l’époque et créer une approche bien spécifique des musiques de jeux vidéo de cette époque qui tranche assez bien avec les productions japonaises.

    J’aime aussi à me souvenir d’un article passionnant de Kenneth Macalpine que je présume on doit pouvoir retrouver dans son ouvrage 8bit music book qui expliquait toute la complexité des premiers « programmeurs » de musiques sur Atari dans la mesure où l’Atari 2600 n’avait pas de processeur sonore permettant de jouer des notes de musiques mais juste du son… et n’était donc pas capable de reproduire les fréquences des notes habituelles do, ré, mi…

    Je suis intéressé à en apprendre plus sur ce que tu décris dans Monkey Island 2, cette approche de musique adaptative ne m’avait pas marquée à l’époque… sur le processeur Adlib FM de ma carte Sound Blaster…

    … Mais il y aurait encore tant à dire n’est-ce pas !

    Aimé par 1 personne

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s