Vés al contingut

Mòdul:llengua/ordre

De Viccionari
La revisió el 16:24, 17 abr 2023 per Vriullop (discussió | contribucions) (rom)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Icona de documentació de mòdul Documentació del mòdul[mostra] [modifica] [refresca]

A continuació es mostra la documentació transclosa de la subpàgina /ús. [salta a la caixa de codi]


Aquest mòdul és una taula que conté les regles d'ordenació per a cada llengua definida pel seu codi. Vegeu Viccionari:Índex d'idiomes.

Aquest mòdul no s'utilitza directament des de mòduls o plantilles. Les dades s'obtenen a través del Mòdul:utilitats.

Cada entrada en la taula pot tenir dos valors alternatius: sort_key_module o sort_key.

El primer, sort_key_module, indica el mòdul on es troba la funció ordena per aquella llengua. Per exemple, per català és sort_key_module="ca-general" (vegeu Mòdul:ca-general).

Alternativament, sort_key defineix les regles de substitució per obtenir la clau d'ordenació. Els patrons de cerca i substitució són els definits en la funció estàndard mw.ustring.gsub. Són similars a les expressions regulars. Vegeu el manual de Lua per a més informació. El propòsit és eliminar caràcters que són ignorats per l'ordenació o substituir caràcters que es tracten igual a efectes d'ordenació en aquella llengua.

L'entrada sort_key és una taula que conté dues taules: from i to. Cada element de la primera (from) és un patró que identifica quins caràcters cal substituir, mentre que l'element corresponent de la segona (to) diu amb què se substituirà. Si l'element from no té el corresponent to, o bé és false o nil, els caràcters s'eliminen. El procés converteix en minúscules el mot a tractar, així que només cal definir els caràcters en minúscula.

Per a futures referències, la càrrega inicial s'ha obtingut de les taules de en:Category:Language data modules.

local u = mw.ustring.char
local m = {}

m["af"] = {
	sort_key = {
		from = {"[äáâà]", "[ëéêè]", "[ïíîì]", "[öóôò]", "[üúûù]", "[ÿýŷỳ]", "^-", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y" }} }

m["be"] = {
	sort_key = {
		from = {"Ё", "ё"},
		to   = {"Е" , "е"}} }

m["ca"] = {
	sort_key_module = "ca-general"}

m["cpg"] = {
	sort_key = {  -- Sincronitzats: cpg, el, grc
		from = {"[ᾳάᾴὰᾲᾶᾷἀᾀἄᾄἂᾂἆᾆἁᾁἅᾅἃᾃἇᾇ]", "[έὲἐἔἒἑἕἓ]", "[ῃήῄὴῂῆῇἠᾐἤᾔἢᾒἦᾖἡᾑἥᾕἣᾓἧᾗ]", "[ίὶῖἰἴἲἶἱἵἳἷϊΐῒῗ]", "[όὸὀὄὂὁὅὃ]", "[ύὺῦὐὔὒὖὑὕὓὗϋΰῢῧ]", "[ῳώῴὼῲῶῷὠᾠὤᾤὢᾢὦᾦὡᾡὥᾥὣᾣὧᾧ]", "ῥ", "ς"},
		to   = {"α"                        , "ε"         , "η"                        , "ι"                , "ο"         , "υ"                , "ω"                        , "ρ", "σ"}} }

m["cs"] = {
	sort_key = {
		from = {"á", "é", "í", "ó", "[úů]", "ý"},
		to   = {"a", "e", "i", "o", "u"   , "y"}} }

m["cu"] = {
	sort_key = {
		from = {"оу", "є"},
		to   = {"у" , "е"}} }

m["cy"] = {
	sort_key = {
		from = {"[âáàä]", "[êéèë]", "[îíìï]", "[ôóòö]", "[ûúùü]", "[ŵẃẁẅ]", "[ŷýỳÿ]", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "w"     , "y"	 }} }

m["de"] = {
	sort_key = {
		from = {"[äàáâå]", "[ëèéê]", "[ïìíî]", "[öòóô]", "[üùúû]", "ß" },
		to   = {"a"      , "e"     , "i"     , "o"     , "u"     , "ss"}} }

m["dsb"] = {
	sort_key = {
		from = {"ó"},
		to   = {"o"}} }

m["el"] = {
	sort_key = {  -- Sincronitzats: cpg, el, grc
		from = {"[ᾳάᾴὰᾲᾶᾷἀᾀἄᾄἂᾂἆᾆἁᾁἅᾅἃᾃἇᾇ]", "[έὲἐἔἒἑἕἓ]", "[ῃήῄὴῂῆῇἠᾐἤᾔἢᾒἦᾖἡᾑἥᾕἣᾓἧᾗ]", "[ίὶῖἰἴἲἶἱἵἳἷϊΐῒῗ]", "[όὸὀὄὂὁὅὃ]", "[ύὺῦὐὔὒὖὑὕὓὗϋΰῢῧ]", "[ῳώῴὼῲῶῷὠᾠὤᾤὢᾢὦᾦὡᾡὥᾥὣᾣὧᾧ]", "ῥ", "ς"},
		to   = {"α"                        , "ε"         , "η"                        , "ι"                , "ο"         , "υ"                , "ω"                        , "ρ", "σ"}} }

m["en"] = {
	sort_key = {
		from = {"[äàáâåā]", "[ëèéêē]", "[ïìíîī]", "[öòóôō]", "[üùúûū]", "æ" , "œ" , "[çč]", "ñ", "'"},
		to   = {"a"       , "e"      , "i"      , "o"      , "u"      , "ae", "oe", "c"   , "n"}} }

m["eo"] = {
	sort_key = {
		from = {"[áà]", "[éè]", "[íì]", "[óò]", "[úù]", "[ĉ]", "[ĝ]", "[ĥ]", "[ĵ]", "[ŝ]", "[ŭ]"},
		to   = {"a"   , "e"   , "i"   , "o"   , "u"   , "cĉ" , "gĉ" , "hĉ" , "jĉ" , "sĉ" , "uĉ"}} }

m["es"] = {
	sort_key_module = "es-general"}

m["eu"] = {
	sort_key = {
		from = {"ç", "ñ" , "ü"},
		to   = {"c", "n~", "u"}} }

m["ext"] = {
	sort_key = {
		from = {"[áâ]", "ç", "é", "[íï]", "ñ" , "[óô]", "[úüû]", "'"},
		to   = {"a"   , "c", "e", "i"   , "n~", "o"   , "u"}} }

m["fi"] = {
	sort_key = {
		from = {"[áàâã]", "[éèêẽ]", "[íìîĩ]", "[óòôõ]", "[úùûũ]", "[ýỳŷüű]", "[øõő]", "æ" , "œ" , "[čç]", "š", "ž", "ß" , "[':]"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"      , "ö"    , "ae", "oe", "c"   , "s", "z", "ss"}} }

m["fr"] = {
	sort_key_module = "fr-general"}

m["frm"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["fro"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["frp"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["ga"] = {
	sort_key = {
		from = {"á", "é", "í", "ó", "ú", "ý", "ḃ" , "ċ" , "ḋ" , "ḟ" , "ġ" , "ṁ" , "ṗ" , "ṡ" , "ṫ" },
		to   = {"a", "e", "i", "o", "u", "y", "bh", "ch", "dh", "fh", "gh", "mh", "ph", "sh", "th"}} }

m["gd"] = {
	sort_key = {
		from = {"[áà]", "[éè]", "[íì]", "[óò]", "[úù]", "[ýỳ]"},
		to   = {"a"   , "e"   , "i"   , "o"   , "u"   , "y"   }} }

m["gn"] = {
	sort_key = {
		from = {"ã" , "ẽ" , "g̃" , "ĩ" , "mb", "nd", "ng", "nt", "ñ" , "õ" , "rr", "ũ" , "ỹ", "['ʼ]"},
		to   = {"añ", "eñ", "gñ", "iñ", "mñ", "n¼", "n½", "n¾", "nñ", "oñ", "rñ", "uñ", "yñ", "´"}} }

m["grc"] = {
	sort_key = {  -- Sincronitzats: cpg, el, grc
		from = {"[ᾳάᾴὰᾲᾶᾷἀᾀἄᾄἂᾂἆᾆἁᾁἅᾅἃᾃἇᾇ]", "[έὲἐἔἒἑἕἓ]", "[ῃήῄὴῂῆῇἠᾐἤᾔἢᾒἦᾖἡᾑἥᾕἣᾓἧᾗ]", "[ίὶῖἰἴἲἶἱἵἳἷϊΐῒῗ]", "[όὸὀὄὂὁὅὃ]", "[ύὺῦὐὔὒὖὑὕὓὗϋΰῢῧ]", "[ῳώῴὼῲῶῷὠᾠὤᾤὢᾢὦᾦὡᾡὥᾥὣᾣὧᾧ]", "ῥ", "ς"},
		to   = {"α"                        , "ε"         , "η"                        , "ι"                , "ο"         , "υ"                , "ω"                        , "ρ", "σ"}} }

m["gv"] = {
	sort_key = {
		from = {"ç", "-"},
		to   = {"c"}} }

m["hu"] = {
	sort_key = {
		from = {"á", "é", "í", "ó", "ú", "[öő]", "[üű]", "cs", "dzs", "gy", "ly", "ny", "zs"},
		to   = {"a", "e", "i", "o", "u", "o~", "u~", "c~", "dz~", "g~", "l~", "n~", "z~"}} }

m["hy"] = {
	sort_key = {
		from = {"ու", "և", "եւ"},
		to   = {"ւ", "եվ", "եվ"}} }

m["it"] = {
	sort_key_module = "it-general"}

m["ja"] = {
	sort_key_module = "ja-trans"}

m["mga"] = {
	sort_key = {
		from = {"á", "é", "í", "ó", "ú", "ý", "ḃ" , "ċ" , "ḋ" , "ḟ" , "ġ" , "ṁ" , "ṗ" , "ṡ" , "ṫ" },
		to   = {"a", "e", "i", "o", "u", "y", "bh", "ch", "dh", "fh", "gh", "mh", "ph", "sh", "th"}} }

m["mh"] = {
	sort_key = {
		from = {"ā" , "ļ" , "m̧" , "ņ" , "n̄"  , "o̧" , "ō"  , "ū" },
		to   = {"a~", "l~", "m~", "n~", "n~~", "o~", "o~~", "u~"}} }

m["mul"] = { -- multilingüe, ordenació per alfabet llatí
	sort_key = {
		from = {"[äáâàåāã]", "æ" , "[ëéêèēẽє]", "[ïíîìīĩ]", "[öóôòōõø]", "œ" , "[üúûùůūŭũ]", "[çčĉċć]", "[ĝġ]", "ĥ", "ĵ", "[ñń]", "[ŝšśṡ]", "[ŵẃẁẅ]", "[ÿýŷỳ]", "[žżź]", "^-", "['·]"},
		to   = {"a"        , "ae", "e"        , "i"       , "o"        , "oe", "u"         , "c"      , "g"   , "h", "j", "n"   , "s"     , "w"     , "y"     , "z"}} }

m["nl"] = {
	sort_key = {
		from = {"[äáâå]", "[ëéê]", "[ïíî]", "[öóô]", "[üúû]", "ç", "ñ", "^-"},
		to   = {"a"     , "e"    , "i"    , "o"    , "u"    , "c", "n"}} }

m["nv"] = {
	sort_key = {
		from = {"[áą]", "[éę]", "[íį]", "[óǫ]", "ń", "^n([djlt])", "ł" , "[ʼ’']", u(0x0301)},
		to   = {"a"   , "e"   , "i"   , "o"   , "n", "ni%1"	  , "l"}} }  -- the copyright sign is used to guarantee that ł will always be sorted after all other words with l

m["oc"] = {
	sort_key = {
		from = {"[àá]", "[èé]", "[íï]", "[òó]", "[úü]", "ç", "([lns])·h"},
		to   = {"a"   , "e"   , "i"   , "o"   , "u"   , "c", "%1h"	  }} }

m["orv"] = {
	sort_key = {
		from = {"оу", "є"},
		to   = {"у" , "е"}} }

m["pcd"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["pi"] = {
	sort_key = {
		from = {"ā", "ī", "ū", "ḍ", "ḷ", "[ṁṃ]", "[ṇñṅ]", "ṭ"},
		to   = {"a", "i", "u", "d", "l", "m"   , "n"	, "t"}} }

m["pl"] = {
	sort_key = {
		from = {"[Ąą]", "[Ćć]", "[Ęę]", "[Łł]", "[Ńń]", "[Óó]", "[Śś]", "[Żż]", "[Źź]"},
		to   = {"a" .. u(0x10FFFF),	"c" .. u(0x10FFFF),	
			"e" .. u(0x10FFFF),	"l" .. u(0x10FFFF),	
			"n" .. u(0x10FFFF),	"o" .. u(0x10FFFF),	
			"s" .. u(0x10FFFF),	"z" .. u(0x10FFFF),	"z" .. u(0x10FFFE)}} }

m["pro"] = {
	sort_key = {
		from = {"ç"},
		to   = {"c"}} }

m["pt"] = {
	sort_key = {
		from = {"[àãáâä]", "[èẽéêë]", "[ìĩíï]", "[òóôõö]", "[üúùũ]", "ç", "ñ"},
		to   = {"a"      , "e"      , "i"     , "o"      , "u"     , "c", "n"}} }

m["ro"] = {
	sort_key = {
		from = {"ă" , "â"  , "î" , "ș" , "ț" },
		to   = {"a~", "a~~", "i~", "s~", "t~"}
	}
}

m["roa-gal"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["roa-grn"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["roa-jer"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["roa-nor"] = {
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }
	
m["roa-oca"] = { -- Romanic - Old Catalan
	sort_key = {
		from = {"à", "[èé]", "[íï]", "[òó]", "[úü]", "ç", "·"},
		to   = {"a", "e"   , "i"   , "o"   , "u"   , "c"}} }

m["rom"] = {
	sort_key = {
		from = {"[àǎáǝ]", "[èëěé]", "[ìïǐí]", "[òǒó]", "[ùǔú]", "ćh" , "ć" , "x" , "kh", "ph", "rr", "ś" , "th", "ź"},
		to   = {"a"     , "e"     , "i"     , "o"    , "u"    , "c~~", "c~", "h~", "k~", "p~", "r~", "s~", "t~", "z~"}} }

m["rom-x-pv"] = {
	sort_key = {
		from = {"[áǝà]", "[éè]", "[íì]", "[óò]", "[úù]", "č" , "x", "š" , "ž"},
		to   = {"a"    , "e"   , "i"   , "o"   , "u"   , "c~", "h", "s~", "z~"}} }

m["ru"] = {
	sort_key = {
		from = {"ё"},
		to   = {"е" .. u(0x10FFFF)}} }

m["sga"] = {
	sort_key = {
		from = {"á", "é", "í", "ó", "ú", "ý", "ḃ" , "ċ" , "ḋ" , "ḟ" , "ġ" , "ṁ" , "ṗ" , "ṡ" , "ṫ" , "^h"},
		to   = {"a", "e", "i", "o", "u", "y", "bh", "ch", "dh", "fh", "gh", "mh", "ph", "sh", "th"}} }

m["sk"] = {
	sort_key = {
		from = {"[áä]", "é", "í", "[óô]", "ú", "ý", "ŕ", "ĺ"},
		to   = {"a"   , "e", "i", "o"   , "u", "y", "r", "l"}} }

m["sq"] = {
	sort_key = {
		from = {'[âãä]', '[êẽë]', 'ĩ', 'õ', 'ũ', 'ỹ', 'ç'},
		to   = {'a'    , 'e'    , 'i', 'o', 'u', 'y', 'c'}} }

m["sv"] = {
	sort_key = {
		from = {'[áà]', 'æ', '[éèë]', 'í', 'õ', 'ø', 'ü', 'ç'},
		to   = {'a'   , 'ä', 'e'    , 'i', 'o', 'ö', 'u', 'c'}} }

m["sw"] = {
	sort_key = {
		from = {"ng'", "^-"},
		to   = {"ngz"}} }

m["tg"] = {
	sort_key = {
		from = {"ё"},
		to   = {"е"}} }

m["tr"] = {
	sort_key = {
		from = {"â", "ç" , "ğ" , "ı" , "î", "ö" , "ş" , "û", "ü"},
		to   = {"a", "c~", "g~", "i@", "i", "o~", "s~", "u", "u~"}} }

m["ty"] = {
	sort_key = {
		from = {'ā', 'ē', 'ī', 'ō', 'ū', "'"},
		to   = {'a', 'e', 'i', 'o', 'u', '’'}} }

m["wa"] = {
	sort_key = {
		from = {"[áàâäå]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"      , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

m["xib"] = {
	sort_key = {
		from = {'[áâ]', 't', 'é', '[kḱ]', 'í', 'ó', '[ŕř]', '[śŝ]', '[úḿm̌]'},
		to   = {'a'   , 'd', 'e', 'g'   , 'i', 'o', 'r'   , 's'   , 'u'}} }
	
m["xx"] = { -- desconegut, usat per defecte, en general per llengües romàniques
	sort_key = {
		from = {"[áàâä]", "[éèêë]", "[íìîï]", "[óòôö]", "[úùûü]", "[ýỳŷÿ]", "ç", "'"},
		to   = {"a"     , "e"     , "i"     , "o"     , "u"     , "y"     , "c"}} }

return m