Wikipedysta:Adoomer/statystyka

Statystyka dot. stubów

edytuj

Zgodnie z sugestią Przykuty w sposób przypadkowy wybrałem listę 200 zalążków i spisałem ich rozmiar (w tabeli umieszczony link do wersji, których rozmiar zapisałem; dane zebrane w dniach 5-7 lipca 2007), po czym umieściłem poza Wikipedią (aby nie zafałszować wyniku badania) i na pięć miesięcy z hakiem porzuciłem. Dzisiaj (tj. 13 grudnia 2007) sprawdziłem stan wybranych artykułów i zapisałem wyniki - aktualny rozmiar i obecność/nieobecność szablonu stub. Przez 5 miesięcy zaledwie 7 na 200 (3,5%) wybranych artykułów straciło szablon stub.

Wnioski

edytuj

Myślę, że najważniejszym wnioskiem wynikającym z tego badania jest fakt, że szablony stub są za rzadko zdejmowane przez wikipedystów. Wiele z artykułów poniżej nie musiało mieć szablonu stub, czego dowodzi fakt, że część artów zostało już zdestubowanych po opublikowaniu wstępnej wersji tej strony. Uważam, że w obliczu tego badania należałoby rozważyć przeprowadzenie przeglądu stubów, czy też zorganizowanie wikiprojektu zajmującego się destubizacją. Formalizacja destubowania na pewno jest niedopuszczalna, ale chyba warto sformułować zalecenia dotyczące używania i (przede wszystkim) nieużywania szablonu stub.

Z badania nie można raczej wyciągać wniosku dotyczącego ogólnego tempa ubywania stubów - próba jest za mała, zresztą należałoby uwzględnić wszystkie słabo rozwinięte artykuły, żeby określić jak szybko przybywa nam zalążków (bo najpewniej tak właśnie się dzieje) i w jakim tempie artykuły są pozbawiane szablonu stub.

Zapraszam do komentowania wyników statystyki. Próba oczywiście dość niewielka w porównaniu do całego zasobu pl.wiki, ale to ze względu na ręczną robotę. Jeśli będzie przygotowywana następna statystyka w tym stylu, to z pewnością znajdzie się jakiś znudzony programista, który zajmie się automatyzacją procesu. Adoomer disputatio 16:16, 13 gru 2007 (CET)[odpowiedz]

Lista przygotowana za pomocą strony Specjalna:Linkujące/Wikipedia:Zalążek artykułu

Data spisania
5-7 lipca 2007
Data sprawdzenia
13 grudnia 2007
Próba
200 artykułów wybranych przypadkowo z ww. strony specjalnej
Ilość artykułów, które utraciły szablon stub
7
co stanowi
3,5%
Ilość artykułów, które utraciły szablon stub po opublikowaniu listy
38
co stanowi
19%

Można byłoby dodać kolumnę z różnicą w % i kb. Przykuta (dyskusja) 18:22, 13 gru 2007 (CET)[odpowiedz]

Ile stuba w stubie

edytuj

Z poniższej usunąłem szablony stuba z 38 artykułów, co oznacza, że (powiedzmy - nie licząc wiosek) w prawie 20% artykułów te szablony wiszą niepotrzebnie. przeglądałem te, które miały powyżej 4kb i kilka mających powyżej 3,5 kb. Tylko w kilku przypadkach z listami i szablonami się zawahałem przed zdjęciem. Tym bardziej przydałoby się botem zbędne szablony pousuwać z większych artykułów - spokojnie na początek z tych, które liczą minimum 5kb. Przykuta (dyskusja) 18:22, 13 gru 2007 (CET)[odpowiedz]

Mam poważne wątpliwości, co do tego rozwiązania - są arty, w których interwiki, infoboxy i listy stanowią zdecydowaną większość rozmiaru artu, podczas gdy treść jest niepełna, żeby nie powiedzieć - uboga. Rozwiązanie z botem jest łatwe, szybkie i przyjemne, ale niedokładne i nierozwiązujące problemu w pełni - po tych początkowych 5kb-i-więcej artykułach trzeba też zająć się tymi, które mają mniej niż 5kb, a i tak są na tyle dobre, by stubami nie być (takich też jest mnóstwo). Trzeba by zliczyć wszystkie stuby jakie mamy, ułożyć w listę i uporządkować - domyślam się, że jest ich bardzo dużo, ale właściwie wszyscy się tylko domyślamy - takich badań (wg mojej wiedzy) wcześniej nie było. A przydałoby się wiedzieć, ile tych stubów w ogóle jest. Co do technicznej strony układania takiej listy, to myślę, że możnaby (oczywiście w miarę techicznych możliwości) oddzielić od tej porządkowanej grupy stubów wszystkie arty opisujące wsie polskie, francuskie, włoskie, etc. - te grupy można przeczesać później (tym bardziej, że łatwa do sprawdzenia jest ilość artów w tych kategoriach - vide Kategorie z największą liczbą artykułów). Adoomer disputatio 22:19, 13 gru 2007 (CET)[odpowiedz]

Wyniki

edytuj
Nazwa zalążka Stan w momencie spisania (5 lipca 2007) Rozmiar (stan na 5 lipca 2007; w bajtach) Rozmiar (stan na 13 grudnia 2007) Obecność szablonu stub (stan na 13 grudnia 2007) L.p.
Benoit Mandelbrot [1] 3611 3718   1
Oberkommando des Heeres [2] 1288 1387   2
Juan Ramón Jiménez [3] 2625 2976   3
Klodiusz Albinus [4] 1160 1206   4
Laktoowowegetarianizm [5] 408 412   5
Aelianus [6] 186 186   6
DMCA [7] 981 1009   7
Edgar Douglas Adrian [8] 1427 1655   8
Henri Bergson [9] 5123 5595   9
Habanera [10] 2764 3189   10
Hiperłącze [11] 2394 2394   11
Kalendarium historii Szkocji [12] 4315 5568   12
IRIX [13] 728 840   13
Ingrid Bergman [14] 6922 13 221   14
Ignacy Oziewicz [15] 1990 2055   15
John Galsworthy [16] 2606 2794   16
Johannes Jensen [17] 2042 2324   17
Jean-François Champollion [18] 2916 11 978   18
Joel Asaph Allen [19] 1251 1199   19
Kwas p-aminobenzoesowy [20] 1499 4081  /  20
Kwintyllus [21] 1709 1968   21
Kaligula (film) [22] 1786 3432   22
Kopiejka [23] 1928 2072   23
Kylix [24] 2005 2005   24
Kalkomania [25] 362 442   25
Lucas Cranach Młodszy [26] 2360 2454   26
Literatura [27] 4883 4888   27
Likier [28] 2292 2508   28
Lucjan Rydel (poeta) [29] 1628 1646   29
Literatura polska - średniowiecze [30] 5591 5591  /  30
Ludy semickie [31] 2850 3332   31
Linus Pauling [32] 3456 3758   32
Licynia Eudoksja [33] 1408 1493   33
Mocznik [34] 2196 2304   34
Mobile [35] 2627 2903   35
Mulak [36] 1406 1611   36
Miguel Ángel Asturias [37] 3491 3681   37
MySQL [38] 6992 7132  /  38
Mszana Dolna [39] 4636 5374  /  39
Mandżukuo [40] 14 300 17 159  /  40
MRNA [41] 2502 3425   41
Mort [42] 1749 1829   42
Nukleotydy [43] 2124 3331   43
NASM [44] 929 923   44
Norbert Wiener [45] 1454 2174   45
Nowela [46] 3797 1491   46
Ornitologia [47] 2650 3702   47
ORP Burza [48] 2465 3326   48
Olkusz [49] 10 929 12 238  /  49
Plik [50] 2278 2488   50
Pruchnik [51] 3237 3141  /  51
Programista [52] 2081 2191   52
Pangea [53] 1807 1865   53
Płyta kontynentalna [54] 718 746   54
Piaskownica zwyczajna [55] 1539 1539   55
Paleografia [56] 1617 1768   56
Petroniusz Maksymus [57] 1607 1805   57
Półpustynia [58] 678 728   58
Papowo Toruńskie [59] 2187 2219   59
Pierre de Fermat [60] 2550 2778   60
Piołunówka [61] 259 267   61
Fulvius Julius Quietus [62] 550 595   62
Reichswehra [63] 1429 9091  /  63
Ropa (dopływ Wisłoki) [64] 953 986   64
Rogowo (powiat toruński) [65] 1733 1637   65
Serwer [66] 4078 4565  /  66
Fantastyka naukowa [67] 7585 7866  /  67
Stan wojenny [68] 5895 6214  /  68
Sigrid Undset [69] 2634 2752   69
Szpekucha [70] 461 471   70
Stanisław Wojciechowski [71] 4022 4484  /  71
Steradian [72] 1476 1511   72
Stary Świat [73] 1009 1028   73
Theodor Mommsen [74] 3488 3752   74
Tlen [75] 10 471 11 412  /  75
Teodozjusz I Wielki [76] 11 377 12 142  /  76
Tyber [77] 1793 1868   77
Tar (informatyka) [78] 2807 2833   78
Ulrich von Jungingen [79] 1766 1830   79
Unia polsko-litewska [80] 4758 4941  /  80
Unia horodelska [81] 3957 3961   81
Wino musujące [82] 954 2137   82
Wojciech Fortuna [83] 2369 2905   83
William Faulkner [84] 5335 5400  /  84
Walens [85] 2223 2319   85
Wyspy Tokelau [86] 2612 2810   86
Wojna litewska [87] 3503 3644  /  87
Państwo wielkomorawskie [88] 3123 6227  /  88
Yasunari Kawabata [89] 3330 3499   89
Zderzenie cywilizacji [90] 4541 4069  /  90
ZAM-2 [91] 2981 3007   91
Świerk (Otwock) [92] 417 433   92
Haploid [93] 964 964   93
Bar mleczny [94] 1894 2120   94
Kaldera [95] 1348 1494   95
Menam [96] 1066 1198   96
Gwinea [97] 5063 9721  /  97
Polska Biblioteka Internetowa [98] 2382 2442   98
Ślęza [99] 1189 1354   99
Albertville [100] 2325 2383   100
Juliusz Kossak [101] 2703 9008   101
Szerzyny [102] 2281 2408   102
Chemia kwantowa [103] 1260 1344   103
Wojsko kwarciane [104] 1847 1847   104
Benazir Bhutto [105] 1481 2675   105
Aleksandrów Kujawski [106] 9521 10 654  /  106
ORP Conrad [107] 2466 2627   107
Niezależność statystyczna [108] 732 311[1]   108
John Nash Jr [109] 2678 2866   109
Lotar I [110] 1305 3610  /  110
Acid rock [111] 869 878   111
Ozyrys (bóg) [112] 2083 2404   112
Regulator odśrodkowy obrotów [113] 1054 1054   113
Liza [114] 393 392   114
Tassos Papadopoulos [115] 1166 1302   115
Musical [116] 5648 6006  /  116
Aszur (miasto) [117] 1262 1433   117
Robotnik (gazeta) [118] 3145 3151   118
Louis Armstrong [119] 4196 4342  /  119
Szyfr przestawieniowy [120] 1565 1564   120
Mudra [121] 1483 1506   121
Osielec [122] 3131 1206   122
Fabiusz Piktor [123] 895 895   123
Raróg (mitologia) [124] 994 994   124
Testbed [125] 654 654   125
Austen Henry Layard [126] 1217 1277   126
Łozina [127] 1476 1748   127
Massa [128] 1081 1135   128
Stephen Hawking [129] 4841 5229  /  129
Friedrich Schlegel [130] 1412 1571   130
Giulio Andreotti [131] 2380 2404   131
Basil Poledouris [132] 6302 6302   132
Hańcza (jezioro) [133] 2111 2279   133
Amfora [134] 1294 1331   134
Mozzarella [135] 981 1060   135
Kultura badaryjska [136] 2816 2786   136
Pinxit [137] 591 591   137
Kazimierz Mikulski [138] 343 439   138
Delfin [139] 2402 2798   139
Ernst Ruska [140] 1204 1346   140
Język klingoński [141] 4046 3562   141
Centuria (armia) [142] 1523 1564   142
Samuel von Pufendorf [143] 1745 1745   143
Filtracja [144] 1410 1450   144
Sauron [145] 4508 4651  /  145
Jean Baudrillard [146] 2379 3266   146
ORP Gdańsk (1939) [147] 1464 1486   147
Magna Charta Libertatum [148] 2318 3611  /  148
C-41 [149] 2445 2445   149
Król Dawid (okręt) [150] 3814 3836  /  150
Tajwan (wyspa) [151] 2558 2582   151
Kaosiung [152] 3549 3590   152
Szirin Ebadi [153] 2178 2301   153
Quality of Service [154] 1691 1706   154
Izostazja [155] 1240 1240   155
Anna Powierza [156] 1712 1713   156
Bajka [157] 2223 2396   157
Ajaccio [158] 3326 3403   158
1 Brygada Legionów Polskich [159] 1270 2192   159
Paracelsus [160] 5754 5798  /  160
Implementacja (informatyka) [161] 1025 1059   161
Stefan Hanka-Kulesza [162] 741 1445   162
The Quarry Men [163] 1989 1992   163
Dustin Hoffman [164] 4748 4916   164
S.P.Q.R. [165] 1392 1428   165
Iliada [166] 3147 6368  /  166
Anders Celsius [167] 7174 7230  /  167
Wyspa Chrząszczewska [168] 945 920   168
James Joule [169] 4167 4238  /  169
Zenon z Elei [170] 3763 3904  /  170
Hans Christian Ørsted [171] 2018 2134   171
Bajkopisarz [172] 333 333   172
Cer [173] 6307 6556   173
Promet [174] 6317 6443   174
Bitwa pod Asturą [175] 354 354   175
Magnum opus [176] 700 765   176
Istota [177] 1217 1217   177
Okręty szkolne typu Wodnik [178] 1793 1802   178
Baranów Sandomierski [179] 4189 4202   179
Klaus Kinkel [180] 920 941   180
Richard Basset [181] 1043 1043   181
Childeryk I [182] 1008 1058   182
Kaseta rowerowa [183] 990 1002   183
Ciekawe czasy [184] 1315 1341   184
Klasa (biologia) [185] 1335 1475   185
Ozorków [186] 8359 8746  /  186
Flora Tatr [187] 23 809 23 826  /  187
Koło opisane [188] 2290 2207   188
Uśnice [189] 1369 1369   189
Latawce [190] 1026 1026   190
Wino miodowe [191] 463 463   191
Traktat paryski (1951) [192] 1057 1085   192
Europejska kolonizacja Ameryki [193] 5054 5230  /  193
Hispania Tarraconensis [194] 873 1407   194
Katalog domowy [195] 1346 1379   195
Ustrój polityczny Hiszpanii [196] 2507 2507   196
Traktat z Tordesillas [197] 2112 2167   197
Hannah Arendt [198] 7588 7956  /  198
Monsanto [199] 6314 6736  /  199
Gąsior (budownictwo) [200] 240 240   200

Przypisy

edytuj
  1. Hasło rozdzielone, dane dla hasła Niezależność zdarzeń



Wzór wpisu

![[Nazwa artu]]
|[adres link]
|{{L|w=ś|f=tak|rozmiar}}
|{{L|w=ś|f=tak|rozmiar}}
|{{tak}}/{{nie}}
|bgcolor="FFF2B2" |lp.
|-