Autoanalyse assistée

Les mots de l’Oreille tendue selon Voyant Tools

 

Deux collègues de l’Oreille tendue, Geoffrey Rockwell (University of Alberta) et Stéfan Sinclair (McGill University), ont créé un logiciel de visualisation et d’analyse de textes.

Vous allez sur le site de Voyant Toolsa web-based reading and analysis environment for digital texts»), vous téléversez du texte, puis vous consultez les résultats.

L’Oreille tendue, qui ne comprend pas grand-chose à ce genre de représentation des textes, y a téléchargé tout le contenu de ce blogue, du 14 juin 2009 au 23 avril 2015. Résultats ?

Le blogue compte au total 540 521 mots; 48 227 seraient des «unique words». On peut les regrouper en nuage, selon leur fréquence (voir ci-dessus). C’est en 2013 que l’Oreille a été la plus prolixe (114 581 mots). Quand on en exclut un certain nombre d’éléments (prépositions, conjonctions, dates, etc.), le vocabulaire est dominé par un mot, «Montréal» (2093 occurrences). Cela s’explique en partie parce que beaucoup de textes publiés dans cette ville sont cités sur le blogue.

En 2012, parmi les «distinctive words», ceux qui ressortent du lot de façon étonnante sur le plan statistique, il y a eu «Charest», du nom du premier ministre de l’époque. En 2015 — mais l’année est jeune —, il s’agit plutôt de mots liés au hockey : «Maurice», «Richard», «Campbell», «émeute».

La rubrique la plus intrigante est «Highest vocabulary density». Explication de Stéfan Sinclair, consulté pour l’occasion : «C’est un ratio qui exprime le nombre de mots uniques par rapport au nombre total de mots. Plus la valeur est haute, plus on peut prétendre que le vocabulaire est divers.» L’Oreille pourrait s’inquiéter : elle a atteint sa plus haute densité lexicale… en 2009. Heureusement, 2015 arrive en deuxième position.

Il y a encore de l’espoir.

P.S.—Pourquoi l’Oreille a-t-elle utilisé le mot «culture» plus souvent en 2014 que durant toutes les autres périodes («Words with notable peaks in frequency across the corpus») ? Elle ne sait vraiment pas.

Cause de décès ?

Soit les deux tweets suivants :

«Le cinéaste finlandais a hâte de retrouver ici ses amis dont @XDolan pas vu depuis 30 ans. Mourant ! http://vimeo.com/113349354» (@trottiermc).

«RT @Lectodome : L’existentialisme de Sartre expliqué en 2 min. Avec la voix de Stephen Fry. http://bbc.in/1NIcNCH • mourant lol !» (@Homegnolia).

Qu’on se rassure : malgré la présence, dans chacun des tweets, du mot mourant, aucun décès n’est à signaler. Ce mot, au Québec, indique que quelque chose est très drôle, que c’est à mourir de rire.

Doublé d’un «lol», c’est encore plus pissant.

Unité de temps

Soit les phrases suivantes, tirées de Parents et amis sont invités à y assister. Drame en quatre tableaux avec six récits au centre d’Hervé Bouchard (2014) :

J’ai le souvenir de m’étendre sous le ciel de mon lit dans le soir et d’attendre le sommeil comme une feuille que le vent pousse. Il arrive enfin, je tombe, pas longtemps, je sais pas, une petite secousse, la maison se balance au souffle des orphelins endormis, j’ai raté quelque chose, je me lève, je vais vers eux dans le noir, je vois rien, ce sont des morts qui respirent, ce sont des empilés qui bougent (p. 64).

Qu’y désigne le mot secousse ? On peut l’entendre doublement.

D’une part, il évoque un «mouvement brusque qui ébranle un corps» (le Petit Robert, édition numérique de 2014). C’est bien à cela que renvoient les mot «la maison se balance» : «une petite secousse, la maison se balance».

D’autre part, secousse est aussi, au Québec, une unité de temps, fort imprécise : Je reviendrai dans une petite secousse. (@TigrouMalin le faisait remarquer un jour sur Twitter.) La grand-mère de l’Oreille tendue disait plutôt escousse. (C’est la même chose et ce n’est pas plus précis.) Ce mot peut avoir le sens, comme ici, de «pas longtemps» : «pas longtemps, […] une petite secousse».

On est ébranlé et on attend (peu), chez Bouchard.

Référence

Bouchard, Hervé, Parents et amis sont invités à y assister. Drame en quatre tableaux avec six récits au centre, Montréal, Le Quartanier, «série QR», 14, 2014, 238 p.