WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 858.096

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 475500 114263 15434 11345 1949 108530
Spaans 195319 12550 2398 4230 358 182127
Frans 25634 5581 1029 2269 184 14213
Noors 20610 3415 769 805 232 2528
Nynorsk 14198 2902 594 1103 194 1868
Engels 12432 7323 1234 1555 258 1668
Tsjechisch 11810 4568 2987 4234 384 2392
Turks 9034 3541 592 544 104 238
Deens 8093 1163 176 204 56 1571
Duits 7782 3603 580 510 122 421
Zweeds 6196 1473 231 460 80 507
IJslands 5075 851 99 138 32 113
Italiaans 4537 2025 181 200 69 9
Russisch 3699 1536 231 195 171 131
Afrikaans 2964 1679 282 287 127 125
Pennsylvania-Duits 2873 1263 90 140 73 208
Indonesisch 2703 1651 295 294 50 0
Nedersaksisch 2286 1272 95 170 74 3
Latijn 2181 855 186 234 90 410
Slowaaks 2121 1067 524 35 47 25
Pools 1670 1150 82 65 18 33
Limburgs 1613 936 85 342 68 34
Catalaans 1564 550 123 657 16 634
Vietnamees 1521 726 231 319 51 0
Portugees 1477 949 81 136 7 1
Lets 1442 713 6 3 172 0
Japans 1441 1079 53 178 25 0
Esperanto 1380 710 72 215 16 0
Hongaars 1238 618 84 105 27 4
Grieks 1138 686 52 23 9 0
Bulgaars 1092 429 18 30 5 62
klassiek Nahuatl 1038 707 26 11 11 0
Welsh 988 661 90 32 5 0
Fins 977 640 31 45 14 0
Perzisch 812 464 18 26 10 7
Iers 783 545 42 24 6 2
Fries 759 472 28 20 22 2
Oekraïens 760 518 31 27 2 0
Xhosa 738 213 8 39 12 29
Veluws 723 426 43 84 31 1
Bretons 707 337 53 71 1 0
Kroatisch 680 347 6 3 0 0
Estisch 671 335 117 0 1 0
Quechua 653 300 46 79 14 12
Koerdisch 648 387 16 29 2 122
Arabisch 640 359 49 62 4 0
Roemeens 639 368 17 40 11 0
Oezbeeks 626 374 21 6 12 0
Papiaments 606 435 30 65 14 0
Mandarijn 596 381 64 100 19 0
Oudnoords 583 243 26 197 5 5
Hindi 588 333 41 59 6 0
Luxemburgs 587 216 22 28 18 6
Chinees 578 381 2 5 2 0
Faeröers 566 214 118 52 8 0
Middelnederlands 568 317 35 153 21 22
Angelsaksisch 551 419 16 17 5 1
Occitaans 546 290 11 26 2 0
Litouws 478 296 2 4 2 0
Baskisch 472 288 29 6 3 0
Koreaans 466 332 2 3 1 0
Achterhoeks 454 265 22 19 12 1
Oudgrieks 452 270 8 29 9 0
Hebreeuws 437 294 4 3 1 0
Servisch 436 309 6 0 1 0