Wiktionnaire:Actualités/112-juillet-2024

Actualités du Wiktionnaire

Numéro 112 — juillet 2024

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Pain.

Une tranche de pain photographiée par Kritzolina (cliquez sur l’illustration pour la voir en entier).

Brèves d’ici

  • Le Wiktionnaire a dépassé les 6 millions de pages le 19 juillet. La nouvelle page qui a permis de passer ce cap est einzuplanende, une forme d’un adjectif allemand, créée par DE8AH.
  • Après de longs mois à rédiger et à débattre d’une Charte du mouvement pour l’ensemble des projets hébergés par la Wikimedia Foundation, celle-ci a lancé une consultation qui s’est terminée ce mois-ci, montrant l’absence de consensus, malgré une majorité forte en faveur de l’adoption de la charte. Le conseil d’administration de la fondation a finalement décidé de ne pas l’adopter.
  • La liste de souhaits de la communauté gérée par la Wikimedia Foundation est relancée ! Ces dernières années, cette collecte de besoins et d’idées d’améliorations des projets wikis durait quelques semaines puis fixait un cap pour l’année suivante. Elle évolue vers un fonctionnement en continu.

À voir ou écouter

Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.

  • France Culture a rediffusé une série audio animée par le neurologue Laurent Cohen au sujet du langage et son interprétation par le cerveau.
  • Athéna Sol prend le temps d’expliquer sur YouTube le concept de glottophobie dans un format plus long que ses vidéos habituelles diffusées par d’autres canaux.
  • Et voici un nouveau fifou, Sami en mission, qui se lance dans la lecture du dictionnaire Robert de A à Z en direct sur internet et en différé sur YouTube.
  • L’animatrice de la chaîne YouTube Fandomandfigments est tombée sur un Dictionary Disney English-Spanish prometteur au premier regard, dans lequel on espère des exemples pris dans les dialogues des films de la marque aux grandes oreilles, mais il ne s’agit que d’explications sur le jargon utilisé par les employés des parcs d’attraction !

Brèves d’ailleurs

  • Nouveau dictionnaire bilingue numérique isiXhosa-anglais présenté par Birgit Ottermann dans un article pour BizCommunity. Ce projet étudiant présente déjà plus de deux milles entrées, et même une version du jeu Wordle pour cette langue parlée en Afrique du Sud !
  • Le Glossaire des patois de la Suisse romande lancé en 1889 vient d’atteindre la lettre J. 125 ans après son lancement, ce glossaire d’une richesse impressionnante est toujours en construction, la variation du francoprovençal suisse fut très largement sous-estimée par ses initiateurs.
  • Avis de publication encore avec le premier tome du Dictionnaire des patronymes algériens de Mustapha Tidjet, annoncé par la Revue française de Généalogie qui annonce plus de 700 patronymes avec leurs explications étymologiques. Il est publié gratuitement en ligne.
  • Le journal La Dépêche invite cet été à la visite de la Maison Claude-Augé, résidence où vécut ce lexicographe qui fut directeur des éditions Larousse, située à L’Isle-Jourdain, à l’ouest de Toulouse.
  • Le Libanais Marwan Kaabour réalise un dictionnaire queer avec les argots LGBT+ arabes : The Queer Arab Glossary. Argots passés et présents dans les régions arabophones, il les a tous rassemblés dans son dictionnaire déjà disponible sur Amazon, il en présente la démarche dans l’article en lien.
  • Damien Gayle rapporte en anglais dans The Guardian des échanges entre des militants écologistes et les lexicographes du Oxford English Dictionary autour de la définition du mot nature. La controverse porte sur le fait d’impliquer les êtres humains dans la nature ou de la définir par exclusion aux créations humaines et à ce qui est culturel. Le dictionnaire de référence indiquait bien les deux façons de voir le monde, mais la définition incluant l’ensemble de toutes choses était placée en seconde place et n’apparaissait pas dans la version gratuite du site internet. Suite aux échanges, cette définition a été rendue visible et apparaît en seconde position, rendant compte des différentes visions de ce qu’est la nature aujourd’hui au sein de la société. Les militants souhaiteraient maintenant que l’ordre des définitions change mais ils ont compris que ce n’est pas au dictionnaire de changer, mais aux usages au sein de la société en premier lieu.
Pain.

Du pain de seigle photographié par Tiia Monto.


Statistiques

Du 20 juin au 20 juillet 2024

  + 279 880 entrées et 138 langues dont le nombre d’entrées a été modifié, pour atteindre 6 236 262 entrées et 1 441 langues avec au moins cinq entrées.   + 1 379 entrées en français pour atteindre 429 605 lemmes et 677 749 définitions.

  Les cinq langues qui ont le plus avancé, outre le français, sont l’italien (+ 166 213 entrées), l’allemand (+ 83 868 entrées), le same du Nord (+ 23 613 entrées), l’occitan (+ 856 entrées), et le kotava (+ 738 entrées).

  Dix nouvelles langues ajoutées ce mois-ci : l’umatilla (+104), le taitnapam (+64), le jeju (+50), l’hindoustani caribéen (+32), le tenino (+31), le wauyukma (+23), le palouse (+21), le klikitat (+10), le walla walla (+10), le kittitas (+2).

  + 3 422 citations ou exemples en français pour atteindre 647 171 pour les entrées en français, et 302 765 pour les entrées d’autres langues (+2 579)

  + 965 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 90 032.

Du 30 juin au 31 juillet 2024

  + 121 674 sections de langue contenant au moins une prononciation audio (dont 107 pour le français) pour atteindre 764 651 sections de langue contenant au moins une prononciation audio pour 177 langues (dont 199 683 pour le français).

  + 10 nouveaux thésaurus ce mois-ci, le total est de 1 241 thésaurus dans 76 langues dont 906 thésaurus en langue française. Les nouveaux thésaurus sont pour la tente, le coffre, la revendication, parler, colorer, dégoût et portefeuille par Noé ; la propriété foncière lors de la rencontre mensuelle lyonnaise ; la non-binarité et l’oubli par Sayoxime.

  + 95 bonnes entrées, pour atteindre 513 bonnes entrées (dont 238 en français, six de plus) et toujours 4 très bonnes entrées. Au total, 20 langues proposent des bonnes entrées, avec une nouvelle langue, le grec ancien.

  Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes. Ce mois-ci, la première place est occupé par le jus de pomme.

  + 13 mots créés sur les 31 proposés dans les Mots du jour ! Merci à Bercours, Bpierreb, Hildepont et Pamputt !


Du pain de sable, cuit dans le sable du Sahara, photographié par Brel.

Dictionnaire du mois

Jacques Beauchesne, Dictionnaire des cooccurrences, Guérin, 2001.

Quand on rédige, il arrive que l’on ait en tête le mot exact que l’on souhaite employer, mais qu’il nous manque le qualificatif approprié ou l’expression dans laquelle l’inclure.

Dans ce cas, le dictionnaire usuel dispense une aide insuffisante : il comporte trop peu d’exemples d’utilisation (à ce sujet, n’hésitez jamais à ajouter un exemple au Wiktionnaire !). Quant au dictionnaire analogique, il aide à trouver des sens connexes, mais guère à préciser une notion.

C’est là qu’intervient Jacques Beauchesne et son grand’œuvre, le Dictionnaire des cooccurrences. Durant une trentaine d’années, M. Beauchesne a patiemment recensé les adjectifs et les verbes s’employant fréquemment avec les substantifs français. Il en résulte un outil très simple et extrêmement utile, qui permet de reprendre rapidement la plume après l’interruption décrite plus haut. Je ne résiste pas au plaisir d’en reproduire un article — par exemple, « grief » :

  • « anodin, imaginaire, (in)juste, (in)justifié, (il)légitime, lourd, mesquin, réel, sérieux, solide, valable, vérifiable.
    Déterrer, entendre, exposer, formuler, nourrir, plaider, présenter, redresser, régler, relever, réparer, ressasser un/des ~(s). »

L’utilité d’un tel article me semble évidente. Dans sa préface, M. Beauchesne cite le mot « ton », dont le nombre de cooccurrences donne le vertige. Pour ne citer que ses qualificatifs commençant par la lettre « D » :

  • « décent, décidé, décisif, déclamatoire, dégagé, dédaigneux, dépersonnalisé, dérisoire, désabusé, descendant, désinvolte, despotique, détaché, déterminé, dictatorial, direct, docte, doctoral, doctrinaire, dogmatique, dolent, doucereux, doux, dramatique, dur »

C’est dans Le Dictionnaire analogique de la langue française de Giuseppe Cappiello (voir les Actualités no 103 d’octobre 2023) que j’ai découvert le Dictionnaire des cooccurrences. Depuis, je l’utilise si régulièrement que je me demande comment j’ai pu faire sans. Et je salue ce travail de titan, continué par les filles de M. Beauchesne.

On pourrait penser qu’à utiliser des occurrences déjà connues, on perdra toute originalité. Mais à l’usage, il me semble que c’est l’inverse qui se produit, et que ce dictionnaire aide à la créativité : une occurrence en appelle une autre, les exemples du dictionnaire me permettent d’avancer, et il m’arrive de choisir un terme qui ne s’y trouve pas.

Ce dictionnaire est accessible en ligne, grâce au portail linguistique du Canada, dont je salue le travail. En parlant autour de moi du merveilleux travail de M. Beauchesne, j’ai constaté qu’il restait quasi-inconnu en France, où je réside. J’espère qu’un jour le site de l’Organisation internationale de la francophonie donnera accès, en un clic, à l’ensemble des ressources lexicographiques francophones disponibles en ligne !
— une chronique par Trace


Mot rare = mot recherché souvent ?

Quels mots sont recherchés dans un dictionnaire ? Est-ce que les entrées de dictionnaire les plus consultées sont les mots les plus courants ou les plus rares ? C’est ce qu’a tenté de mesurer l’étude de Robert Lew et Sascha Wolfer parue récemment dans Sage, et s’appuyant sur le contenu de l’édition anglophone du Wiktionnaire.

Plusieurs critères sont analysés : le nombre de consultation des entrées du Wiktionary, la fréquence d’apparition dans un corpus de référence, la polysémie des entrées (nombre de sens différents), l’âge d’acquisition des mots et le degré de circulation du mot (appelé « prévalence » dans l’étude, mesuré par des questionnaires demandant si les gens sont familiers avec les mots ou non). Les conclusions de l’étude vont vers une corrélation forte entre fréquence dans un corpus et besoin de recherche dans un dictionnaire : plus un mot apparaît souvent, plus les gens le recherchent. En outre, plus il est polysémique et plus il est recherché ; plus il est appris tard dans le cours de la vie, plus il est recherché ; moins il est connu et plus il est recherché. Ces quatre critères allant dans cet ordre d’importance. L’article conclut qu’il existe d’autres paramètres, dont la classe des mots (noms, verbes, adjectifs, etc.), mais que ces premiers résultats pourraient déjà orienter une politique éditoriale, une priorisation dans la rédaction d’un dictionnaire.

Le Wiktionnaire se développe sans considération pour les fréquences des mots ou pour les chiffres de consultation, et une hypothèse qui n’est pas dans l’article mais que je peux formuler est qu’il est probable que les entrées du Wiktionnaire les plus souvent lues ne soient pas les plus méticuleusement élaborées. Ce sont souvent les plus anciennes et il me semble que pour la majorité du contributorat, il est plus stimulant de rédiger une nouvelle entrée plutôt que de reprendre le travail d’autrui pour l’améliorer et le compléter.

Pour aller dans le sens de l’article, il semble que récupérer et analyser les informations de fréquence, d’âge d’apprentissage et de notoriété puisse permettre d’orienter la contribution, de développer davantage les entrées les plus susceptibles d’être consultées. Mais sans direction éditoriale qui mène à cibler en priorité certaines formes de contribution, il n’est pas exclu qu’un tel travail de recueil de données et d’analyse ne soit un coup d’épée dans l’eau et qu’une très faible partie du contributorat seulement ne modifie sa façon de contribuer malgré ces informations. Pour autant, ces indicateurs pourraient aider à réaliser des manques et points faibles pour que le Wiktionnaire gagne en qualité en même temps qu’en quantité d’entrées, et donner lieu à des défis ponctuels, des projets tutorés ou des stages au sein de formation à la lexicographie.

Un autre aspect à considérer sur ce sujet, c’est que les mots les plus recherchés changent régulièrement, avec des pics évanescents liés à l’actualité et parfois difficiles à anticiper. Ces étoiles filantes sont pourtant à décrire « avant que ne naisse le besoin », pour qu’au moment opportun, le Wiktionnaire puisse déjà proposer des informations pertinentes et utiles. Le défrichage de nouveaux termes émergents est donc complémentaire du travail de fond sur les entrées les plus fréquentes dans les textes et les deux dynamiques de contribution ne devraient pas se gêner mais au contraire se nourrir.
— une chronique par Noé


Les enclises

Les enclises sont des formes verbales dans lesquelles des mots grammaticaux dont des indices pronominaux sont ajoutés au verbe sous la forme de suffixes ou de clitiques. En français ce sera par exemple « allez-vous-en » ou encore « partez-y ». Bien qu’il existe quelques rares cas particuliers de verbes aux formes spécifiques — « fussè-je » par exemple — les enclises en français sont plutôt simples, comparées à celles des autres langues néo-latines ou du latin vulgaire.

Les linguistes Tobler et Mussafia décrivent une règle grammaticale portant le nom de loi Tobler-Mussafia pour la langue vernaculaire médiévale, la langue d’oïl et d’autres langues romanes. La phrase ne peut pas commencer par un pronom faible et, par conséquent, les clitiques (en particulier les pronoms), s’ils ne sont pas précédés d’un élément fort, sont joints au verbe auquel ils se réfèrent. En espagnol médiéval on trouve par exemple dans le poème Cantar de Mio Cid au vers 204, une enclise au début de phrase : « Reçibió lo El Cid ». En italien archaïque, en revanche les choses se compliquent encore plus car il était possible de rajouter n’importe quel pronom à n’importe quelle forme verbale, si par exemple elle suit la conjonction e comme dans cet extrait de Dante : « e menommi al cespuglio che piangea ».

Aujourd’hui la plupart des langues romanes ont connu une perte ou une simplification du système d’enclise. L’unique exception est le sicilien qui a perdu les enclises pour ensuite les réinsérer lors du XVIIIe siècle, pour imiter la façon de parler des Toscans, pour ensuite perdre à nouveau les enclises dès la fin de la mode toscane. L’italien, bien qu’il ait lui aussi assisté à une simplification, possède encore un système enclitique complexe. Voir par exemple la liste des formes enclitiques des verbes « fare » et « farsi ».

Effectivement, l’italien a un système enclitique vaste. Les formes auxquelles on peut ajouter des suffixes pronominaux sont l’impératif, les participes, le gérondif et l’infinitif. Les suffixes qui peuvent être ajoutés sont les suivants :

Dans des cas beaucoup plus rares il est même possible d’avoir trois pronoms consécutifs. C’est le cas de incontrarvicisi. Les enclises sont tendanciellement utilisées en Italie du Nord et surtout en Toscane tandis que dans le Sud elles sont plutôt rares.

Le Wiktionnaire documente les enclises en italien dans une catégorie qui compte fin juillet plus de 415 000 entrées.
— une chronique par Àncilu Pisani

La collaboration du mois de juillet

Une nouvelle proposition de Noé, les légumes !

Juillet

Le Wiktionnaire décrit 645 légumes et légumineuses en français, mais bien moins dans les autres langues ! Avant le mois, 197 langues avaient des listes de légumes  (280 aujourd’hui) et il y avait seulement 23 entrées en roumain (26 aujourd’hui), 11 en coréen (18 aujourd’hui) ou 5 en slovaque (6 aujourd’hui) ! Pour le français, il y en avait 701 en fin de mois et 705 maintenant !

De nouvelles traductions sont à documenter et pour les ranger facilement, vous pouvez ajouter au début de la ligne de la définition le modèle {{légumes}} en indiquant après une barre droite le code de langue. Par exemple {{légumes|af}} pour l’afrikaans !

Est-ce que ce thème ne vaut pas un radis ou est-ce son auteur qui n’a plus un radis ?


Voir tout le classement

Sur le podium, ce sont 56 nouvelles entrées pour le français, 49 pour l’allemand, 30 pour le kotava, 24 pour le flamand occidental et autant pour le latin. Ce sont 750 nouvelles entrées qui ont été créées ou indiquées comme étant des légumes (catégorisées), pour 160 langues différentes, dont 59 langues qui ont maintenant une catégorie pour les légumes alors qu’elles n’en avait pas encore avant ce mois. Les personnes les plus impliquées ce mois-ci, et qui l’ont indiqué sur la page du projet sont Unsui, Treehill et Harmonide.

Mois suivant

En août, nous découvrirons les sauces !


Les collaborations de la semaine de juillet

Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé, Cantons-de-l'Est, Hildepont et MukiNuki. Merci de leurs contributions aux personnes qui ont créé de nouvelles entrées : Bercours et MacOS Weed dont c’est la première contribution au Wiktionnaire !

Semaine 27 (1er au 7 juillet 2024)

 
Emelina Soares réalise un tapis de sable, de l’art éphémère.

Le sable est un matériau granulaire qui est utilisé de diverses façons en art : animation de sable, dessin aux sables colorés, dessin sur le sable du Vanuatu, sculpture de sable, tableau de sable.

Semaine 28 (8 au 14 juillet 2024)

 
Bâtiment de la Cour pénale internationale.

Autour de la journée internationale de la justice internationale, le 17 juillet, parlons un peu de droit international pénal. Il prend place autour de la Cour pénale internationale établie par le Statut de Rome et de la Cour permanente d’arbitrage (anciennement connue comme Tribunal de La Haye). Ce droit s’ajoute aux principes de justice des États qui y adhèrent selon le principe de complémentarité.

Semaine 29 (15 au 21 juillet 2024)

 
Les rouages du temps sont insondables, même si son étude remonte à la nuit des temps.

Même si le Wiktionnaire publie beaucoup de termes et de locutions sur le temps, le sujet ne semble pas épuisé. Voici quelques suggestions en lien avec le temps, certaines suivies de liens vers des exemples d'usage.

Semaine 30 (22 au 28 juillet 2024)

 
Un quai de chargement, chef d’œuvre logistique.

Cette semaine c’est l’occasion d’améliorer notre lexique de la logistique. En créant par exemple quai de chargement ou de déchargement, palette perdue, palette prisonnière, unité de stockage, jeu de manutention, couverture de stock, etc. Un petit tour dans le lexique du transport est également nécessaire pour catégoriser les entrées qui couvrent les deux thématiques.

Semaine 31 (29 juillet au 4 août 2024)

 
La licorne, un animal imaginaire.

Tu aimes les animaux ? Mais… lesquels ? Plutôt animal totem, animal utile, animal de portage, animal de rente, animal fossile ?

Semaines suivantes

En août : de l’escalade, des dérives, des tentes et des langues !

Les thésaurus de la semaine de juillet

Ces nouvelles suggestions hebdomadaires, affichées sur la page d’accueil, ont été proposées par Lepticed7. Merci de leurs contributions aux personnes qui ont participé à ces thésaurus : Sayoxime et Harmonide !

Semaine 27 (1er au 7 juillet 2024)

Semaine 28 (8 au 14 juillet 2024)

Semaine 29 (15 au 21 juillet 2024)

Semaine 30 (22 au 28 juillet 2024)

Semaine 31 (29 juillet au 4 août 2024)

Semaines suivantes

En août, les sujets des thésaurus à créer seront : pieuvre, chapellerie, géocaching, blog !

Du pain de pommes de terre, photographié par Daderot.


Courrier du lectorat

Je connais depuis au moins une décennie le Dictionnaire des cooccurrences, mais je n'avais jamais envisagé son utilisation pour améliorer mon discours écrit (ou parlé). C'est une découverte sympathique.   Cantons-de-l'Est (discussion) 4 août 2024 à 09:48 (UTC)[répondre]


Je pense qu'il serait profitable que le Wiktionnaire se dote d'une ligne éditoriale qui souligne l'importance d'améliorer, le plus possible, les entrées les plus fréquemment consultées, tout en suscitant la création (ou le maintien) d'une équipe concentrée sur ce travail de fond. Toutefois, si mes observations sur la communauté du Wiktionnaire sont valides, je doute qu'une telle équipe voit le jour faute d'un nombre suffisant de participants sur le long terme, parce que ce wikitravail n'est pas ludique. Désolé d'exprimer mon pessismisme. Cantons-de-l'Est (discussion) 4 août 2024 à 09:57 (UTC)[répondre]

Je suis d’accord avec ton observation, et je doute également que l’investissement dans le lancement du projet soit accompagnée d’une réalisation dans la durée. Cela après avoir initié de très nombreux projets ces dernières années, avec des ambitions variables (thème de la semaine, projet du mois, etc.). Cependant, on est pas à l’abri d’une bonne surprise, d’être déçu en bien comme on dit en Suisse et en Savoie. Parfois une ou deux personnes s’impliquent un temps puis des années plus tard à nouveau d’autres personnes, qui reprennent les outils en place et s’en servent pour leurs objectifs ou d’une manière proche mais avec une dimension un peu différente. C’est le cas par exemple en ce moment avec l’évaluation qualitative (les bonnes entrées et très bonnes entrées) ébauché en 2013, puis que j’ai établi en 2015 pour quelques mois avant que ça ne tombe en désuétude, et qui est repartie depuis quelques mois grâce à Harmonide et DE8AH ! 🙂 Noé 5 août 2024 à 19:12 (UTC)[répondre]

Les photographies sur le thème du pain m'ont fait  . Cantons-de-l'Est (discussion) 4 août 2024 à 09:59 (UTC)[répondre]

Merci ! 🙂 Noé 5 août 2024 à 19:12 (UTC)[répondre]

Anciens numéros