Archives pour la catégorie Numérique

Autoanalyse assistée

Les mots de l’Oreille tendue selon Voyant Tools

 

Deux collègues de l’Oreille tendue, Geoffrey Rockwell (University of Alberta) et Stéfan Sinclair (McGill University), ont créé un logiciel de visualisation et d’analyse de textes.

Vous allez sur le site de Voyant Toolsa web-based reading and analysis environment for digital texts»), vous téléversez du texte, puis vous consultez les résultats.

L’Oreille tendue, qui ne comprend pas grand-chose à ce genre de représentation des textes, y a téléchargé tout le contenu de ce blogue, du 14 juin 2009 au 23 avril 2015. Résultats ?

Le blogue compte au total 540 521 mots; 48 227 seraient des «unique words». On peut les regrouper en nuage, selon leur fréquence (voir ci-dessus). C’est en 2013 que l’Oreille a été la plus prolixe (114 581 mots). Quand on en exclut un certain nombre d’éléments (prépositions, conjonctions, dates, etc.), le vocabulaire est dominé par un mot, «Montréal» (2093 occurrences). Cela s’explique en partie parce que beaucoup de textes publiés dans cette ville sont cités sur le blogue.

En 2012, parmi les «distinctive words», ceux qui ressortent du lot de façon étonnante sur le plan statistique, il y a eu «Charest», du nom du premier ministre de l’époque. En 2015 — mais l’année est jeune —, il s’agit plutôt de mots liés au hockey : «Maurice», «Richard», «Campbell», «émeute».

La rubrique la plus intrigante est «Highest vocabulary density». Explication de Stéfan Sinclair, consulté pour l’occasion : «C’est un ratio qui exprime le nombre de mots uniques par rapport au nombre total de mots. Plus la valeur est haute, plus on peut prétendre que le vocabulaire est divers.» L’Oreille pourrait s’inquiéter : elle a atteint sa plus haute densité lexicale… en 2009. Heureusement, 2015 arrive en deuxième position.

Il y a encore de l’espoir.

P.S.—Pourquoi l’Oreille a-t-elle utilisé le mot «culture» plus souvent en 2014 que durant toutes les autres périodes («Words with notable peaks in frequency across the corpus») ? Elle ne sait vraiment pas.

Quelques nouveaux mots en bibliothèque

Caricature du New Yorker

C’est connu : les bibliothécaires gèrent des collections. C’est moins connu : dans ces collections, il y a des néologismes. Allons-y voir.

Le travail des bibliothécaires a été bouleversé par l’arrivée du numérique, puis, plus récemment, par celle des usagers nés dans l’univers numérique. En anglais, on parle de digital natives. En français, on voit, mais rarement, digiborigène (aborigène digital) ces personnes qui ont grandi «avec l’ordinateur et les écrans portables, le Web et les réseaux sociaux», dixit le Devoir du 7 février 2015. Sur Twitter, @revi_redac faisait remarquer, à la suite de la parution de cet article, que le mot numéborigène (aborigène numérique) aurait été plus juste en français.

Les bibliothécaires ne travaillent pas que pour ces natif numériques (le Devoir, bis). Ils s’adressent à toutes sortes de clientèles et doivent leur offrir de nouveaux services. Parmi ceux-ci, il y a le prêt de tablettes numériques, tablettes dont les bibliothécaires se servent eux aussi pour aider les usagers, notamment, mais pas exclusiement, pour la référence nomade. Dès lors, pourquoi ne pas parler, avec @bibliomancienne, de tablothèque et donc de tablothécaires (les tabletarians), travaillant auprès des tablonautes ? S’agissant d’applications, on parlera d’applithécaire. On imagine donc facilement qu’ils doivent désormais développer des compétences techiques, devenir, pour certains, des informathécaires biblioticiens.

Cela étant, la mission des bibliothécaires dépasse la simple gestion d’outils. Ils sont là pour lutter, entre autres maux, contre l’illectronisme, cette fracture numérique, et pour donner accès à l’information sous toutes ses formes.

Plusieurs de ces néologismes sont rarement utilisés, du moins pour l’instant. Ce n’est pas le cas de curation (et de microcuration) et de curateur, voire de curationnisme, de curatorial ou de curator (en France, en français) auxquels il faut faire une place à part, vu leur succès.

Ces mots viennent de l’anglais, où on a pu les entendre sous diverses formes : curation (et auto-curation), curator, curationism, curatorial. Dans Vicky Cristina Barcelona, le film de Woody Allen (2008), quand ses hôtes l’interrogent sur ce qu’elle compte faire dans la vie, Vicky, jouée par Rebecca Hall, répond : «Maybe teaching maybe curating

Son sens ? Voici la définition qu’en proposait Nathalie Collard dans la Presse du 12 mars 2012 («Le curateur est-il un créateur ?», cahier Arts, p. 8).

Il n’y a pas si longtemps, le terme «curateur» était surtout associé au monde muséal, le curateur (ou conservateur) étant celui qui choisit les œuvres qui seront présentées dans le cadre d’une exposition.
Aujourd’hui, on a étendu la définition de la «curation» — un mot très laid, il faut en convenir — à toutes sortes de contextes, dont le travail journalistique. Le curateur (traduction du terme curator ou content curator) est celui qui choisit, trie, organise, hiérarchise, met en contexte et donne un sens à des objets ou à des informations. Le curateur fouille le web à la recherche d’informations et d’images qu’il juge pertinentes et intéressantes, les organise à sa façon et les partage avec les autres internautes sur son propre site.
[…]
À la différence de l’agrégateur de contenu qui se résume en gros à un vulgaire algorithme, le curateur est un être en chair et en os, curieux et passionné, qui passe des heures à explorer le web à la recherche de perles.

Sur le site RG Mobility, le 28 juin 2013, on proposait de distinguer la curation de l’agrégation et de la syndication :

Chaque fois que vous publiez un lien de contenu vers un autre site ou sur votre réseau social ou peut parler de curation s’il s’agit d’une action «manuelle» alors que si vous collectez et partagez automatiquement ce que vous trouvez à partir de mots clés, on parlera plutôt d’agrégation (Netvibes, Google Reader…). Quant à la syndication il s’agit plus d’une technologie qui permet de rendre disponible une partie du contenu de votre site ou blog afin qu’elle soit utilisée par d’autres sites où lecteurs de flux RSS.

Tout le monde n’aime pas la chose elle-même — «La curation, nouvelle tarte à la crème du web ?», «Non à la “curation”» — ou le mot et ses dérivés. On les retrouve sur la «Lake Superior State University’s 40th Annual List of Banished Words». Certains leur préfèrent médiateur (@audreyrozowy), webinier (@francispisani), éditeur (@LucGauvreau), conservateur (ce serait volontiers le choix de l’Oreille tendue), commissaire, voire fluxeur (@fbon).

Comme d’habitude, c’est l’usage qui tranchera, en bibliothèque et au-delà.

P.S.—Merci à @bibliomancienne, dont deux tweets — ici et — ont inspiré cette entrée de blogue.

Les 13 néologismes numériques du jour

«Twitter, especially, is an ideal
incubator for neologisms»
(Ian Crouch, The New Yorker).

Algorédacteur : «journaliste» assisté (Thierry Berthier).

Bluedildonique : vibrateur (dildo dans la langue de Shakespeare) couplé à une connexion Bluetooth (la Presse+).

Copinaute : «J’ai entendu “copinautes”, pour amis du web. Étrangement, j’aime bien» (@revi_redac).

Crowdcensoring : «“Chine : 2 M d’agents en charge de censurer Internet” Après le sourcing et le funding, le crowdcensoring» (@piotrr70).

Pour traduire crowdfunding, on a proposé sociofinancement. Sociocensure pour crowdcensoring ? Non.

Cyberdildonique : voir Bluedildonique.

Gallicanaute : «internaute utilisant Gallica et participant activement à la diffusion des documents de la bibliothèque numérique sur le Web (blogs, réseaux sociaux)» (Lettre de Gallica, 40, 15 mai 2013).

Métajournalisme : «Ce métajournalisme se situera à la racine du traitement algorithmique et assurera la supervision et l’orientation des systèmes de rédaction automatisés» (Thierry Berthier).

Racketiciel : logiciel que le consommateur est obligé d’acheter en achetant son ordinateur (Non aux racketiciels).

So-Lo-Mo : «À l’heure du So-lo-mo (social-local-mobile), la radio est le MÉDIA de choix selon l’animatrice» (la Presse, 13 août 2011, cahier Arts et spectacles, p. 3).

Télédildonique : voir Bluedildonique.

Textambulisme : «art de texter pendant son sommeil» (@FabienDeglise).

Torrenter : télécharger avec le protocole BitTorrent, selon le Nicolas Dickner de Six degrés de liberté (p. 321).

Webnaliste : «Le webnaliste n’existe pas encore officiellement, mais cela ne saurait tarder. Il combinera les expertises du journaliste à celles de l’analyste, mais dans un contexte numérique» (François Descarie).

Référence

Dickner, Nicolas, Six degrés de liberté, Québec, Alto, 2015, 292 p.