La musique urbaine latino-américaine au crible de la linguistique de corpus : le cas Bad Bunny

Benjamin Aguilar Laguierce est traducteur professionnel. Après des études hispaniques spécialisées en traduction et linguistique (master études hispaniques et hispano-américaines) et en traduction (master traduction pour l’édition, spécialité anglais), il se dédie à la recherche en traductologie, linguistique et lexicologie, la traduction éditoriale, la jurilinguistique et la traduction technique.

Introduction

2020 semble avoir été l’année de tous les superlatifs pour Bad Bunny, chanteur de reggaeton portoricain. Artiste musical le plus écouté sur Spotify[1], il a reçu plusieurs nominations aux Latin Grammy et Grammy Awards avant d’être reconnu compositeur de l’année 2020 par les prestigieux prix ASCAP[2].

Méthodologie

C’est ce contexte qui nous invite à nous pencher sur l’œuvre de Bad Bunny pour en tirer des conclusions d’un point de vue linguistique. Aussi, afin d’obtenir un échantillon cohérent et scientifiquement viable, nous avons décidé d’étudier le corpus de paroles des chansons issues de l’album YHLQMDLG sorti en 2020. Cet album est composé de vingt titres, à savoir :

  1. Si veo a tu mamá
  2. La difícil
  3. Pero ya no
  4. La santa
  5. Yo perreo sola
  6. Bichiyal
  7. Soliá
  8. La zona
  9. Qué malo
  10. Vete
  11. Ignorantes
  12. A tu merced
  13. Una vez
  14. Safaera
  15. 25/8
  16. Está cabrón ser yo
  17. Puesto pa’ guerrial
  18. P FKN R
  19. Hablamos mañana
  20. <3

Pour des raisons de rigueur scientifique, nous avons rétabli dans les chansons les ablations, élisions et abréviations de mots employées. Pour des raisons de concision et de disponibilité ample de l’information, nous ne retranscrirons pas l’ensemble des paroles de chanson.

Premiers résultats

Le corpus ainsi obtenu est composé de 9455 mots, pour 2024 formes uniques, soit un indice de richesse lexicale de 0,214, ce qui est assez peu élevé[3] pour un corpus à caractère musical. Nous ne sommes pas surpris que les termes les plus fréquents soient d’abord des mots outils, à l’image de no (377 occurrences), que (308), a (234), yo (224), la (214), y(210), me (207) ou encore ey (200). Ce dernier est peut-être le premier terme surprenant dans la mesure où il s’agit d’une interjection, mais étant caractéristique du style musical du chanteur-compositeur, notre surprise est à relativiser.

Il nous est possible de deviser dès à présent une très forte concentration terminologique réflexive de la voix poétique, ce qui nous invite à penser que le moi occupe une place prépondérante dans les préoccupations de Bad Bunny (ainsi, on dénombre 547 déclinaisons de termes réflexifs :  yo, me, et mi)

Le premier lemme dans la liste des termes les plus fréquents est perreo (34 occurrences), suivi de baby (28), ella (27), hoy(26), sola (26), mami (23) ou encore dios (15), ce qui nous donne une suite assez hétérogène et plutôt digne d’oxymore, dans un champ lexical général orienté autour des relations amoureuses voire simplement charnelles entre la voix poétique et les femmes.

Nous observons également une profusion d’onomatopées qui a de quoi dérouter certains, à l’image de ey (200 occurrences), eh (95), prr (31), ah (29), wuh (28), as (25), ja (22), yeh (21), yeah (20), mo (19), r (17), eh-eh (14), brr (12), jaja (12), ma (12), hmm (9), oh (9), be (8), he (8), mu (8), nah (8), pr (8), ay (6), bla (6) ou encore huh (6), soit un total accumulé de 579 occurrences d’onomatopées, ce qui représente pas moins de 0,6% du texte de l’ensemble des chansons de l’album en question.

Ordre Terme Occurrences
1 no 377
2 que 308
3 a 234
4 yo 224
5 la 214
6 y 210
7 me 207
8 ey 200
9 te 174
10 de 140
11 en 135
12 se 132
13 lo 121
14 pero 106
15 el 103
16 si 101
17 eh 95
18 con 91
19 está 81
20 los 79
21 qué 68
22 ya 65
23 64
24 para 60
25 por 58

Tableau 1 – Liste des 25 termes les plus fréquents dans YHLQMDLG

Préoccupations majeures de l’œuvre YHLQMDLG

En analysant un peu plus en profondeur la fréquence de termes connexes et redondants, il est possible de dégager quatre thématiques principales dans cette œuvre, à savoir :

Séduction

Perreo (34 occurrences), Baby (28), Sola (26), Mami (23), Gusta (12), Darte (11), Rico (11), Flow (10), Cojones (9), Entera (9), Cama (8), Duro (8), Papi (8), Perrea (8), Perrearte (8), Bum-bum (7), Amas (6), Amiguita (6), Babies (6), Culo (6), Fucking (6), Amo (5), Amor (5), Panty (5), Amiga (4), Bebé (4), Mojada (4), Romance (4).

Désir et volonté

Quiero (33), Quieres (20), Gana (15), Quieren (15).

Spiritualité

Vivo (17), Dios (16), Vida (10).

Solitude

Soltera (11), Solo (10).

Conclusion

Pour conclure sommairement, nous manifesterons notre relative surprise de ne voir que très peu de lemmes figurer au sein des 25 termes les plus fréquents de l’album en question.

 

[1] https://www.dw.com/es/triunfa-la-música-latina-bad-bunny-es-el-artista-más-escuchado-este-año-en-spotify/a-55785757

[2] https://www.slang.fm/noticias/bad-bunny-es-reconocido-como-compositor-del-ano-en-los-premios-ascap-2020/

[3] D’après les pistes théoriques tracées par Mathieu VALETTE, Méthodes pour la veille lexicale. Journée d’étude : le dictionnaire électronique, 2007, Kénitra, Maroc. pp.15-29. Le corpus est scindé en trois sous-corpus issus de la presse hebdomadaire française de 2004 à 2008.

You might also enjoy: