WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 779.509

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 405644 79586 14191 10713 1860 104097
Spaans 195288 12528 2393 4227 358 182124
Frans 25317 5397 972 2251 181 14161
Noors 18496 3249 722 790 232 2409
Nynorsk 13394 2780 555 1066 193 1754
Engels 12196 7186 1194 1509 256 1645
Tsjechisch 11648 4448 2971 4232 380 2391
Turks 9015 3530 591 544 104 238
Deens 7842 1134 178 202 56 1569
Duits 7495 3496 555 479 116 398
Zweeds 6070 1590 207 445 77 505
IJslands 5049 841 99 138 32 113
Italiaans 4427 1981 176 199 68 9
Russisch 3340 1422 188 151 140 94
Afrikaans 2897 1636 274 280 124 125
Indonesisch 2688 1643 295 294 50 0
Latijn 2113 832 181 230 90 401
Nedersaksisch 2093 1285 80 141 66 3
Pennsylvania-Duits 2189 996 59 120 63 151
Slowaaks 2051 1057 522 33 46 23
Limburgs 1554 907 83 342 66 34
Pools 1564 1107 82 63 17 32
Catalaans 1518 530 122 654 16 631
Vietnamees 1499 714 231 319 51 0
Portugees 1440 929 75 136 7 1
Lets 1414 705 6 3 172 0
Japans 1403 1060 53 177 25 0
Esperanto 1352 694 72 215 16 0
Hongaars 1214 607 84 105 27 4
Grieks 1116 670 52 23 9 0
Bulgaars 1062 419 18 30 5 62
Welsh 925 638 90 32 5 0
Fins 888 585 27 30 12 0
Perzisch 779 449 18 26 10 7
Iers 754 531 42 24 6 2
Xhosa 731 210 8 39 12 29
Oekraïens 713 485 31 27 2 0
Fries 702 448 25 20 21 2
Bretons 683 327 54 71 1 0
Veluws 681 434 42 77 29 1
Kroatisch 654 330 6 3 0 0
Estisch 642 316 117 0 1 0
Quechua 637 294 46 79 14 12
Koerdisch 619 375 16 29 2 122
Roemeens 605 353 17 33 11 0
Arabisch 602 344 48 62 4 0
Mandarijn 596 380 64 100 19 0
Papiaments 582 428 30 64 14 0
Oudnoords 579 240 26 197 5 5
Hindi 565 319 41 58 6 0
Luxemburgs 558 206 22 22 14 5
Faeröers 543 207 118 52 8 0
Chinees 536 362 2 5 2 0
Occitaans 531 282 11 26 2 0
Angelsaksisch 506 410 15 11 5 0
Middelnederlands 502 284 29 127 16 4
Achterhoeks 447 289 22 16 12 0
Oudgrieks 448 270 7 29 8 0
klassiek Nahuatl 575 404 11 7 4 0
Litouws 445 281 2 4 2 0
Baskisch 438 273 29 6 3 0