Wiktionnaire:Actualités/067-octobre-2020
Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves d’ici
- La Bibliothèque municipale de Lyon Part-Dieu organise depuis plusieurs années des rendez-vous de contribution aux projets collaboratifs en ligne, intégrant de plus en plus une dynamique transversale interprojet. Le jeudi 15 octobre, le thème proposé était le vocabulaire de la reliure, qui a permis l’amélioration du thésaurus de la reliure, la création des entrées reliure pleine peau, couvrure en cuir, papier marbré et comblage ainsi que l’amélioration de demi-reliure, jaspure, dos brisé, grecquer, ferlet, gabarit, passure, ais et plaçure. Merci à Briqueloup, NinaLust, Mnjida, Maringue, Vaulque, Lyokoï et aux personnes non-inscrites pour leur participation ! Merci aussi à l’équipe de Numelyo pour son soutien à ces initiatives et sa participation !
- La Bibliothèque universitaire des langues et civilisations de Paris accueille le 17 octobre un premier atelier d’initiation et de contribution au Wiktionnaire et à Lingua Libre grâce à l’association Plateforme Atlas, créée dans le but de rapprocher l’étude des langues faiblement documentées et les outils de partage de connaissance collaboratifs. Eavq et WikiLucas00 ont présenté le Wiktionnaire et Lingua Libre. Les participants se sont essayés à la contribution en amis, en arabe, en coréen, en italien, en kabyle, en macédonien, en wushi, en yoruba, et en yiddish. Une prochaine session en ligne sera organisée.
- Suite à de nombreuses discussions, une rénovation de l’en-tête de la page de discussion communautaire, la Wikidémie, a été mise en place ce mois-ci ainsi qu’une réfaction des pages automatiques apparaissant à la recherche de pages inexistantes. Ces changements sont dus aux efforts de conception graphique de Koreller qui a profité (subi ?) des retours de DenisdeShawi, Jpgibert, Noé, Snawei, Thomas Linard, Otourly et Assassas77. Ces changements ont été validé par un vote communautaire et une longue discussion.
- Une nouvelle discussion est engagée sur l’amélioration du moteur de recherche afin qu’il donne plus d’informations sur les pages suggérées lors de la saisie.
Statistiques
- Du 20 septembre au 20 octobre 2020
+ 34 236 entrées et 95 langues modifiées pour atteindre 4 132 842 entrées et 1 191 langues avec au moins cinq entrées.
+ 1 897 entrées en français pour atteindre 387 638 lemmes et 587 983 définitions.
Les trois langues qui ont le plus avancé outre le français sont le portugais (+ 20 489 entrées), le same du Nord (+ 7 296 entrées) et l’espagnol (+ 1 434 entrées).
+ 8 nouvelles langues pour un total de 4 867 langues : le méroïtique (+16), le moyen écossais (+11), le purépecha (+9), le mazahua du Michoacán (+4), le vieil écossais (+2), le kija (+2), le kwakum (+1), le mixtèque du sud de Puebla (+1).
+ 3 062 citations ou exemples en français pour atteindre 447 626.
+ 169 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, pour atteindre 51 152.
+ 1 566 prononciations (dont 758 pour le français) pour atteindre 218 931 prononciations audios pour 122 langues (dont 100 319 pour le français). Le français dépasse donc les 100 000 prononciations audio ce mois-ci.
+ 5 nouveaux thésaurus pour atteindre 847 thésaurus dans 65 langues dont 598 thésaurus en langue française ! Les nouveaux thésaurus sont la cellule vivante en russe par Pom445, le film d’animation en chinois par Popolon, le thésaurus de la réflexion en français par Tambuccoriel, la pensée en espéranto par Lepticed7 et architecture en français par Trace.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 5 mots créés sur les 31 proposés dans les Mots du jour. Passé de mode le mot du jour ?
+ 5 domaines sémantiques : sudoku, ontologie, pathologie, addictologie, conditionnement.
La rubrique Wiktionnaire:Questions sur les mots (WT:QM) a enregistré 35 questions en octobre contre 34 en septembre et 19 questions en août.
Brèves d’ailleurs
- Mise à jour importante du Dictionary of South African English avec une nouvelle interface orientée vers la consultation mobile. Plus de 4 000 entrées sont présentées avec de nombreux exemples illustrant les usages de l’anglais tel qu’il est parlé en Afrique du Sud.
- Le site Arcamax considère que le 16 octobre est la journée du dictionnaire et publie en cette occasion une liste de nouveaux mots apparus dans les dictionnaires d’anglais par années vous permettant de découvrir les nouveaux mots ajoutés votre année de naissance.
- Le Dico des ados passe la barre symbolique des 3 500 entrées avec le mot seul présenté par Kitel, une administratrice de 14 ans ! Félicitations à elle et à l’ensemble des bénévoles jeunes et moins jeunes qui font vivre ce projet ! Un vote a également eu lieu ce mois-ci pour changer la couleur du logo du bleu vers le orange, plus distinctif.
- Isabelle Kersimon décrypte dans un article les mots islamo-gauchisme et islamo-droitisme sur le site de l’Institut de recherche et d’étude sur les radicalisations. Une première source pour améliorer ces entrées d’actualité dans le Wiktionnaire ?
- Alice Raybaud propose au journal Le Monde un article choc : Faut-il gommer son accent pour réussir son entrée dans la vie active ?, qui aborde les problématiques de la norme dominante et de la perception des accents.
- Alice Develey propose pour Le Figaro un entretien avec Jean Pruvost à propos de l’histoire de la langue française.
- Suzanne Raga a compilé pour le site anglophone Mentalfloss une liste de douze faits surprenants sur les dictionnaires.
- Victor Connes et Nicolas Dugué proposent sur le site de vulgarisation scientifique Papier-Mâché un article titré Quand les algorithmes reproduisent les stéréotypes : le cas du traitement automatique du langage qui présente brièvement les méthodes de la linguistique computationnelle et notamment le plongement lexical.
- Le 28 octobre est décédé Alain Rey à l’âge de 92 ans. Ce lexicographe, connu pour son travail chez les éditions Robert où il y a dirigé la rédaction du Grand et du Petit Robert, est une des rares figures de la lexicographie reconnue par le grand public, notamment grâce à ses nombreuses apparitions à la radio et à sa volonté de vulgarisation de la lexicographie et de la linguistique du français. Des hommages lui ont été rendu dans de nombreux journaux : Le Devoir, Le Figaro, Marianne, Paris Match, Le Point, Tribune de Genève, etc. C’était un modèle inspirant pour plusieurs personnes parmi nous. Puisse-t-il reposer en paix.
- Alexander Delaporte propose sur son blog un nouveau billet pour identifier à qui s’adresse un dictionnaire bilingue.
- Sur son blog dédié au Moyen-Âge, Hugo Blanchet lance une série d’analyses de mots qui viennent de loin avec un premier billet sur lobby.
- Mathieu Goux, spécialiste de l’histoire de la langue française, vient de mettre en place un blog appelé Questions de langue sur lequel il va republier des brèves qu’il publie chaque lundi sur Twitter à propos de la grammaire de la langue française.
Ressources langagières
En mai 2020 devait se tenir la douzième conférence Language Resources and Evaluation à Marseille, un très grand rassemblement d’experts en ingénierie de la langue du monde entier. La conférence n’a pas eu lieu mais les actes ont été publiés en ligne. Voici quelques articles intéressants. Si vous en lisez d’autres qui mentionnent ou utilisent le Wiktionnaire, n’hésitez pas à les présenter ici !
- Massively Multilingual Pronunciation Modeling with WikiPron par Jackson L. Lee et al. : création d’une base de mots avec leurs prononciations pour 160 langues, à partir du Wiktionnaire anglophone.
- ENGLAWI: From Human- to Machine-Readable Wiktionary par Franck Sajous et al. : un minage du Wiktionnaire anglophone pour en faire une version requêtable par une machine.
- Wikinflection Corpus: A (Better) Multilingual, Morpheme-Annotated Inflectional Corpus par Eleni Metheniti et Günter Neumann : création d’une base de flexions à partir du Wiktionnaire anglophone, pour 138 langues.
- Common Voice: A Massively-Multilingual Speech Corpus par Rosana Ardila et al. : présentation de quelques résultats obtenus par l’équipe de Mozilla avec son outil de collecte de prononciations audio, Common Voice.
- Urban Dictionary Embeddings for Slang NLP Applications par Steven Wilson et al. : utilisation de Urban Dictionary comme dictionnaire pour entraîner une IA sur la détection de sens.
- Recent Developments for the Linguistic Linked Open Data Infrastructure par Thierry Declerck et al. : État des lieux du web sémantique lexicographique au niveau européen.
Dictionnaire du mois
Les éditions du Dictionnaire Le Robert
Les éditions Dictionnaires Le Robert sont à l’origine du dictionnaire éponyme. Créée en 1951 par Paul Robert, elles ont fini par se hisser à égalité avec les éditions Larousse, implantée depuis bien plus longtemps dans les ventes de dictionnaires. Cela s’explique par le publication de dictionnaires innovants qui ont rapidement conquis le public. En effet, alors que la forme d’une entrée de dictionnaire courante à l’époque est assez simple (MOT : Une ou plusieurs définitions, avec possiblement des citations et des exemples d’usage), Robert veut offrir plus. Le seul dictionnaire accessible à l’époque ayant plus d’information était le Dictionnaire de la langue française d’Émile Littré, établit en 1863. Et c’est d’ailleurs ce dernier qui sera l’inspiration première de Paul Robert, lorsqu’il lance son projet de rédaction. Il veut faire comme le Littré, mais en agrémentant les mots de liens analogiques en plus de leurs étymologies et de citations d’actualité.
C’est ainsi que nait celui qu’on appellera le « Grand Robert » mais qui dans sa première édition était titré « Dictionnaire alphabétique et analogique de la langue française » lors de sa sortie en 1964. Cette analogie qui s’exprime par les liens de synonymies et d’antonymies omniprésents dans l’ouvrage. Cette première publication de la « société du nouveau Littré » (premier nom des éditions Le Robert) a pris 13 ans de rédaction. Un travail conséquent dirigé par Alain Rey, diplômé de lettres et d'histoire de l'art à la Sorbonne, engagé dès 1952 pour apporter son expertise stylistique puis lexicographique. La même année est engagée Josette Debove, linguiste issue de la Sorbonne également, qui prendra le secrétariat de la rédaction et apportera ses connaissances linguistiques pour la description des mots. Et de fait, elle deviendra la première femme lexicographe reconnue (en 1952… ).
Trois ans plus tard, en 1967, la même équipe sortira le « Petit Robert », version plus courte, elle ne tient plus qu’en un seul tome, contrairement à 7 ou 5 pour la première et la deuxième édition du Grand Robert. L’ouvrage n’est pas annualisé tout de suite, mais il est apprécié du public pour qui le Grand Robert était trop cher et trop encombrant. Intégrant rapidement des néologismes ainsi qu’un vocabulaire provenant des argots, il fait sa place à côté du Larousse jugé trop souvent timide à l’intégration de nouvelles entrées et sur le vocabulaire. Devant le succès, c’est le Petit Robert qui devient l’ouvrage phare de la maison d’édition, qui se contentera de seulement 2 éditions supplémentaires du Grand Robert, et se contentant de seulement le réimprimer régulièrement hormis ça.
Néanmoins, l’établissement d’une équipe de lexicographes expérimenté·e·s a permis aux Éditions Le Robert de publier une pléthore d’ouvrages autour de la langue française. Que ce soit d’autres dictionnaires parfois très innovants, parfois plus classiques mais ciblé sur des publics particuliers (écoliers et écolières, apprenant·e·s du français, etc…), parfois plus spécialisés. Et contrairement à Paul Robert, qui ne publiera que très peu d’ouvrages à côté de son dictionnaire, Alain Rey et Josette Rey-Debove publieront beaucoup d’ouvrages notamment scientifiques. Leur vision très ouverte sur la langue (descriptif plutôt que prescriptif, très favorable à la féminisation, à la promotion de l’argot et des régionalismes…) en ont fait des personnes marquantes dans leurs milieux respectifs d’études et, pour Alain Rey, pour le grand public grâce à ses interventions radiophoniques nombreuses.
Pour conclure, je redirigerai celles et ceux qui veulent en lire plus sur le sujet vers l’ouvrage « Les dictionnaires Le Robert » publié en 2003 et accessible sur ce lien.Les collaborations de la semaine d’octobre
Ces propositions, affichées sur la page d’accueil, ont été proposées par Noé et Sebleouf. Merci de leurs contributions aux personnes qui ont créé les mots !
Semaine 40 (28 septembre au 4 octobre 2020)
Semaine 41 (5 au 11 octobre 2020)
Semaine 42 (12 au 18 octobre 2020)
Semaine 43 (19 au 25 octobre 2020)
Semaine 44 (26 octobre au 1er novembre 2020)
Semaines suivantes
Collaboration du mois
La proposition du mois était de s’intéresser aux locutions ! La plupart des thèmes hebdomadaires comportent déjà de nombreuses entrées avec des suites de mot, car les mots simples sont déjà bien renseignés, mais pour autant, il reste difficile dans certains cas de déterminer si une entrée est nécessaire ou s’il s’agit d’une composition normale de la langue, qui n’est pas mémorisée à part par les locuteurs et locutrices de la langue. Pas de gros travaux ce mois-ci, mais le projet reste ouvert pour qui veut rejoindre la réflexion sur ce sujet ! Pour le mois de novembre, comme il y a nouveau confinement, on propose un nouveau défi de création de thésaurus !
La frange lexicale
Pour décrire une langue, il est possible d’étudier de nombreux aspects complémentaires qui participent à la définir comme une langue : inventaire des sons, système des sons, inventaire des assemblages de sons qui ont un sens, système pour l’agencement des assemblages, cadres d’usage et registres, usages paralinguistiques tel que la gestuelle et les bruits, etc. Un dictionnaire va présenter surtout la partie d’inventaire, en ayant besoin des autres éléments pour bien l’expliquer, et c’est pour ça que le Wiktionnaire propose l’indication de la prononciation, donne des informations grammaticales complexes et essaye parfois en note d’expliquer les usages sociaux ou la gestuelle expressive.
L’inventaire est appelé aussi le lexique de la langue, ce sont tous les éléments disponibles à une communauté, qui sont intégrés dans la langue. Certains mots ou certaines expressions circulent mais ne sont pas tout à fait perçues ou considérées comme intégrées, elles restent dans les marges, dans ce qu’on appelle affectueusement la frange lexicale.
Cette zone grise, floue, mouvante, peut couvrir un ensemble très large de termes, selon la vitesse de circulation des mots et la vitesse à laquelle ils sont décrits par les dictionnaires. Les dictionnaires à publication annuelle ont permis de réduire la taille de la frange lexicale, et le Wiktionnaire, capable de décrire près de 15 000 nouveaux termes en un an, va probablement encore venir réduire la taille de cette frange ! Il demeurera cependant toujours des usages non-décrits dans les dictionnaires, qui ne sont qu’une tentative de représentation de la réalité. De même que l’on dit que la carte n’est pas le territoire, on pourrait dire que le dictionnaire n’est pas le lexique.À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
- France Culture et son journaliste Philippe Garbit ont publié une série de 13 épisodes audios en baladodiffusion de la série « Nuit des Dictionnaires », avec notamment des rediffusions d’archives sur la thématique.
- L’institut des langues rares de Paris lance un cycle de conférences diffusées en direct sur leur chaîne YouTube dont la première vidéo est diffusée le 29 octobre 2020 avec Scott DeLancey, grand spécialiste des langues sino-tibétaines.
- Nouvel épisode de l’émission audio La langue bien pendue avec des chroniques sur la langue et Mathieu Avanzi comme invité.
- Pas encore mentionné ici, les Pompiers de Paris proposent des vidéos d’explication de leur jargon.
- L’émission de baladodiffusion Parler comme jamais revient pour une nouvelle saison avec un premier épisode le 28 octobre sur la question de savoir si les jeunes parlent mal. L’émission est portée par Laélia Véron et Maria Candea, produite cette année par les éditions Le Robert.
- L’émission L’humeur de Linda consacre ce mois-ci des épisodes à l’écriture inclusive, à l’expression être habillé comme la chienne à Jacques, au mot le plus long et au couvre-feu.
- Une petite vidéo de moins de trois minutes pour en savoir plus sur les francophones en Amérique.
- Et une autre de trois heures de Monté de la chaîne Linguisticae sur l’histoire et la simplification de l’ortografe.