WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 767.722

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 397717 77212 13972 10516 1824 103305
Spaans 195280 12519 2388 4226 358 182125
Frans 25181 5296 945 2235 179 14150
Noors 17431 3146 711 787 231 2354
Nynorsk 13004 2708 546 1063 192 1713
Engels 11885 7036 1165 1462 245 1561
Tsjechisch 10584 3927 2963 3704 378 2386
Turks 9014 3529 591 544 104 238
Deens 7832 1131 178 202 56 1570
Duits 7411 3462 547 466 116 389
Zweeds 5824 1384 182 439 76 503
IJslands 5049 841 99 138 32 113
Italiaans 4364 1959 172 188 67 9
Russisch 3337 1421 188 151 140 94
Afrikaans 2869 1613 272 279 124 125
Indonesisch 2686 1641 295 294 50 0
Latijn 2068 817 174 216 89 391
Pennsylvania-Duits 1982 910 50 115 62 140
Slowaaks 1899 928 519 33 46 23
Nedersaksisch 1953 1209 67 132 62 3
Catalaans 1518 530 122 654 16 631
Limburgs 1528 890 83 342 66 34
Vietnamees 1499 714 231 319 51 0
Portugees 1434 924 74 136 7 1
Pools 1493 1047 82 61 16 30
Lets 1413 704 6 3 172 0
Japans 1403 1061 53 177 25 0
Esperanto 1349 694 72 214 16 0
Hongaars 1214 607 84 105 27 4
Grieks 1112 666 52 23 9 0
Bulgaars 1062 419 18 30 5 62
Welsh 921 636 90 32 5 0
Fins 886 583 27 30 12 0
Perzisch 779 449 18 26 10 7
Iers 754 531 42 24 6 2
Xhosa 731 210 8 39 12 29
Oekraïens 710 482 31 27 2 0
Bretons 683 327 54 71 1 0
Kroatisch 654 330 6 3 0 0
Fries 681 433 25 20 21 2
Estisch 642 316 117 0 1 0
Quechua 637 294 46 79 14 12
Veluws 643 406 39 71 29 1
Koerdisch 619 375 16 29 2 122
Roemeens 605 353 17 33 11 0
Arabisch 601 344 47 61 4 0
Mandarijn 596 380 64 100 19 0
Oudnoords 579 240 26 197 5 5
Papiaments 580 427 30 64 14 0
Hindi 565 319 41 58 6 0
Luxemburgs 553 206 22 21 13 4
Faeröers 543 207 118 52 8 0
Chinees 536 362 2 5 2 0
Occitaans 530 281 10 26 2 0
Angelsaksisch 502 408 13 11 5 0
Middelnederlands 490 277 28 124 16 4
Litouws 445 281 2 4 2 0
Achterhoeks 444 288 22 16 12 0
Baskisch 437 273 29 6 3 0
Oudgrieks 433 270 7 16 8 0