WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 786.748

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 409351 80793 14328 10790 1864 104523
Spaans 195297 12536 2397 4229 358 182126
Frans 25426 5476 1000 2262 182 14181
Noors 19057 3296 740 795 232 2458
Nynorsk 13668 2816 574 1076 194 1800
Engels 12260 7218 1211 1533 257 1651
Tsjechisch 11667 4443 2971 4232 380 2391
Turks 9023 3537 592 544 104 238
Deens 7876 1140 179 204 56 1570
Duits 7553 3518 566 485 118 400
Zweeds 6088 1599 207 445 77 506
IJslands 5060 844 99 138 32 113
Italiaans 4438 1992 177 200 68 9
Russisch 3350 1428 188 151 140 94
Afrikaans 2915 1651 278 283 126 125
Indonesisch 2691 1645 295 294 50 0
Latijn 2143 847 181 232 90 402
Nedersaksisch 2183 1255 89 162 70 3
Pennsylvania-Duits 2354 1058 69 120 65 159
Slowaaks 2069 1035 522 34 46 24
Limburgs 1578 918 84 342 66 34
Pools 1594 1095 82 64 17 32
Catalaans 1544 538 123 657 16 634
Vietnamees 1506 720 231 319 51 0
Portugees 1457 938 81 136 7 1
Lets 1426 706 6 3 172 0
Japans 1419 1066 53 178 25 0
Esperanto 1364 700 72 215 16 0
Hongaars 1224 611 84 105 27 4
Grieks 1121 673 52 23 9 0
Bulgaars 1076 423 18 30 5 62
Welsh 973 655 90 32 5 0
Fins 903 594 27 30 12 0
Perzisch 797 457 18 26 10 7
Iers 769 538 42 24 6 2
Xhosa 733 210 8 39 12 29
Oekraïens 728 492 31 27 2 0
Fries 728 454 27 20 22 2
Bretons 694 331 54 71 1 0
Veluws 709 423 43 84 31 1
Kroatisch 663 337 6 3 0 0
Estisch 654 324 117 0 1 0
Quechua 643 296 46 79 14 12
Koerdisch 633 378 16 29 2 122
Roemeens 620 357 17 40 11 0
Arabisch 623 352 48 62 4 0
Mandarijn 595 380 64 100 19 0
Papiaments 593 429 30 64 14 0
Oudnoords 579 240 26 197 5 5
Hindi 573 324 41 58 6 0
Luxemburgs 571 211 22 27 15 6
Faeröers 552 208 118 52 8 0
Chinees 552 368 2 5 2 0
Occitaans 535 284 11 26 2 0
Angelsaksisch 525 415 16 16 5 1
Middelnederlands 520 288 31 140 16 4
Achterhoeks 452 264 22 19 12 1
Oudgrieks 448 270 7 29 8 0
klassiek Nahuatl 1031 700 26 11 11 0
Litouws 456 283 2 4 2 0
Baskisch 457 282 29 6 3 0