Wikisource:Projet Wikidata
Bienvenue sur le projet Wikidata |
L’objet de ce projet est de permettre à tous les wikisourciens intéressés de comprendre ce que fait Wikidata et en quoi il est intéressant d’y participer, et de faciliter et centraliser les aspects pratiques de cet effort.
Nous essaierons de vous donner un maximum d’informations pour vous débrouiller de manière autonome… mais les tâtonnements sont fréquents, et il existe beaucoup de manières d’indiquer certaines choses. Il est donc indispensable de coordonner les pratiques.
Membres du projet
[modifier]VIGNERON, Yann, Le ciel est par dessus le toit, Aristoi, Acélan, Tpt et Harmonia Amanda : pour commencer à réfléchir et jeter les bases… on mettra sur le Scriptorium quand ça sera un peu décanté.
Il n’y a pas d’inscription d’office. Ajoutez votre signature (avec 3 tildes) en bas de la liste si vous vous intéressez à ce projet ou si vous souhaitez vous y impliquer.
Le fait de vous inscrire ne vous crée pas d’obligation en terme de travail… juste en terme de respect des règles qui vont y être mises en commun…
- Hélène (d)
- Harmonia Amanda (d)
- VIGNERON (d)
- Ash Crow (d)
- Aristoi (d)
- Fralambert (d)
- Alan (d)
- Tpt (d)
- Thibaut120094 (d)
- Cendrars83 (d)
- Yann (d)
- Psychoslave (d)
- Toto256 (d)
- Marceau (d)
- Acer11 (d)
- Èric (d)
- Zyephyrus (d)
- Barsetti46 (d)
- ManuD (d)
- Lupin~fr (d)
- Cobalt~frwiki (d)
- Ambre Troizat (d)
- Jahl de Vautban (d)
- FreeCorp (d)
Conséquences du projet pour Wikisource
[modifier]Avantages
[modifier]- facilitation du partage des informations (pour les auteurs non francophones par exemple)
- liens automatisés avec les autres projets et les autres langues
- récupération automatique des données de Wikidata, une fois qu’elles existent, au lieu de devoir tout refaire à la main à chaque nouvelle entrée, en particulier pour les œuvres multi-éditées et traduites.
- normalisation des données (pour qu’un éditeur puisse être identifié comme le même, quel que soit le nom qui figure sur la page de titre, par exemple)
- et d’autres développements à terme, comme la possibilité d’accéder à des données de représentations pour les pièces de théâtre, d’adaptation cinématographique, etc, de liens automatisés entre textes et partitions d’opéras, de chansons, etc., des données bibliographiques autour d’une œuvre ou d’un auteur (critique, biographie…).
- automatisation des liens sur les documents liés sur Wikimedia Commons (comme les illustrations séparées du fac-similé), et vers les projets frères qui utiliseront nos références.
- valorisation de notre travail en facilitant l’automatisation de liens vers notre édition en ligne d’un texte dans les bibliographies de Wikipédia : une édition bien référencée sur Wikidata, c’est une édition réutilisable à l’infini pour citation, dans tous les projets, en bibliographie, mais aussi pour le Wiktionnaire ou Wikiquote.
Inconvénients
[modifier]- une charge de travail en plus, et conséquente au démarrage. En effet, tous les textes qui sont sur Wikisource ont vocation à être référencés sur Wikidata ; à ce jour 419 531 textes.
- un wikisourcien n’est pas nécessairement un bibliothécaire né.
- des habitudes de travail et de saisie très différente entre Wikisource et Wikidata…
- contributions sous CC0, seule licence actuellement possible sur Wikidata
- abandon aussi extensif que possible de tout droit sur les données stockés sur Wikidata,
- incertitude juridique sur la réutilisation des données Wikidata
- Il n’y a pas d’obligation à citer les sources importés sur Wikidata et donc à garantir la traçabilité des éventuels licences couvrant les jeux de données. Le problème est double :
- la légalité de l’importation dans Wikidata d’une d’une « partie substantielle des données » de Wikisource est douteuse,
- toute partie des données de Wikidata ayant été importé sans source expose à un risque juridique pour quiconque en réutilise une partie substantielle. Ceci étant, les données peuvent contenir des informations de source, et il est possible de filtrer automatiquement les données pour ne garder que les données dont l’origine 1) ne fait aucun doute 2) est connu pour permettre effectivement une réutilisation sous licence libre.
- Ceci étant, comme de nombreuses œuvres de Wikisource, sont du domaine public, l’extraction de données des pages des œuvres en question doivent a priori ne poser aucun problème. C’est plus délicat pour les pages auteurs, et autres qui ne procède pas d’une retranscription, ainsi que pour les œuvres qui sont sous licence libre mais pas dans le domaine public.
- Il n’y a pas d’obligation à citer les sources importés sur Wikidata et donc à garantir la traçabilité des éventuels licences couvrant les jeux de données. Le problème est double :
Principes de base
[modifier]Wikidata, c’est quoi ?
[modifier]Wikidata est une gigantesque base de données partagée et structurellement multilingue, qui permet de stocker dans un dépôt unique des informations (data) partageables entre tous les projets frères (Wikipédia, Wikisource, Wikimedia Commons, Wikiquote, Wiktionnaire, et autres) et toutes les langues d'un même projet, au lieu de les recréer sur chaque projet, avec tous les risques de différences, voire de contradictions, existant du simple fait de la reproduction, pas mise à jour, des informations en de multiples endroits.
-> voir aussi Aide:Wikidata
Structure de Wikidata
[modifier]Wikidata est un projet multilingue (plus de 300 langues à l’heure actuelle).
Sur Wikidata, toutes les données sont gérées à partir d’éléments conceptuels item, pourvus d'un identifiant unique (ou QID) qui est un numéro commençant par Q, de libellés ou label, de descriptions et d’alias, dans toutes les langues des projets. Ce sont ces données multilingues qui permettent de retrouver un élément, quelle que soit la langue qu'on utilise, et de faciliter l’accès immédiat à tout élément dans toutes les langues. L’affichage de langue utilisé est géré automatiquement par les préférences utilisateurs et l’extension Babel.
Toutes les informations de Wikidata sont des données, ce qui signifie qu’elles sont totalement structurées, et qu’on ne peut pas entrer une information n’importe comment : on doit obligatoirement utiliser la procédure de déclarations (ou statements), lesquelles sont constitués de propriétés auxquelles on attribue une valeur, dont le type est fixé et imposé par la propriété utilisée.
Ces valeurs sont de plusieurs types :
- un autre élément (par exemple l’auteur d'un livre)
- une donnée textuelle (avec indication de langue) (le titre d'un livre)
- une date, à la précision plus ou moins grande
- un lien vers un fichier sur Wikimedia Commons
- des identifiants d’autres bases de données (comme la BnF) qui génèrent automatiquement un lien vers la fiche concernée
- une adresse url
- une valeur numérique.
principe du sourçage des données
[modifier]Chaque propriété peut être enrichie de qualificatifs ou qualifiers, pour préciser des informations, comme par exemple circa une date, ou avant une date.
Chaque propriété doit, en principe, être sourcée individuellement, car les données doivent pouvoir être récupérées automatiquement par des infobox par exemple, et la source d'une déclaration n’est pas nécessairement la source d'une autre déclaration.
Nous avons toutefois une chance énorme : les données bibliographiques sont considérés comme auto-référencées, puisque c’est le livre lui-même qui porte les informations qu'on indique. Il est donc inutile de sourcer le fait que le titre du livre est « son titre » .
Trouver de l’aide sur Wikidata ?
[modifier]Toutes les langues sont représentées sur Wikidata, y compris pas mal de langues mortes… et on peut y communiquer dans toutes les langues (à condition de trouver un interlocuteur qui comprend), toutefois la langue d’échange principal est l’anglais.
- Les francophones ont la chance de disposer d'un Bistro actif, et fréquenté par plusieurs wikisourciens, donc n’hésitez pas à aller y poser vos questions, si vous êtes perdu ou ne trouvez pas comment faire une opération précise.
- Il existe aussi plusieurs projets qui concernent les textes, dont un pour les livres et un pour les périodiques. On discute surtout en anglais sur ces projets.
Différents aspects concernés
[modifier]En gros, ça, c’est déjà fait… : il n’y a qu’à mettre à jour des nouveaux auteurs… et aussi, compléter les informations sur les auteurs créés. Voir, en particulier /Tâches.
Textes de l’espace principal
[modifier]
- ça c’est nouveau… on n’a jamais fait jusqu’ici !!!… ben si, en fait !! tout comme Monsieur Jourdain, ça fait des années qu'on fait du FRBR sans le savoir -> Éditions multiples
- définition d’une œuvre unique (comme Anna Karénine (Q147787), qui permettra de rattacher toutes les éditions dans toutes les langues ; pour les textes traduits de Shakespeare, Goethe, Cicéron ou Pétrarque, ça complique un peu le travail au début (à cause de la nécessité de connaître le titre original dans la langue concernée)… mais le gain est immense !
- automatisation du lien vers l’article de Wikipédia sur l’œuvre (s’il existe).
- automatisation du lien entre toutes les éditions, dans toutes les langues pour les textes que nous offrons (modalités à revoir et étudier)
- facilité d’accès et de référencement de nos éditions pour les bibliothèques et universités du monde entier, qui, à partir d’un seul élément de Wikidata pourront savoir que nous avons mis en ligne une ou plusieurs éditions du texte.
- /Propriétés
Liens interwikis
[modifier]Tpt : parce que toi seul voit ce que ça implique…
- nécessité de complètement revoir la gestion des liens entre les traductions, soit par un modèle, soit de manière idéale par une fonctionnalité intégrée de Wikisource, qui rapatrierait automatiquement toutes les éditions liées à une même œuvre.
Propriétés
[modifier]- voir /Propriétés pour le détail des propriétés à utiliser selon les informations qu'on veut transférer.
- page sur wikidata pour les microdata à ajouter dans les modèles
Exemples
[modifier]Outils et gadgets
[modifier]- voir /Outils regroupant tous les outils existants et à venir pour faciliter le travail.
Statistiques
[modifier]- 14 285 auteurs, dont 2 n’existent pas encore sur wikidata (au 1er février 2018)
- 419 531 textes.