Naar inhoud springen

WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek

De voortgang van WikiWoordenboek

[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders

[bewerken]

Het huidige bestand van WikiWoordenboek

[bewerken]

Totaal aantal lemma's: 912.196

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal

[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 526450 134739 16161 12047 2037 117075
Spaans 195332 12551 2400 4234 358 182725
Frans 26137 5857 1084 2348 197 14305
Noors 21558 3490 788 816 238 2600
Nynorsk 14615 2963 605 1116 199 1909
Engels 13640 8133 1400 2104 262 1805
Tsjechisch 11815 4570 2987 4234 384 2392
Turks 9035 3542 592 544 104 238
Deens 8134 1167 176 204 56 1570
Duits 7929 3654 591 540 130 437
Zweeds 6188 1475 231 460 80 507
IJslands 5143 857 99 139 32 113
Italiaans 4556 2032 186 203 70 9
Russisch 3730 1560 232 195 171 132
Afrikaans 2968 1683 282 287 127 125
Pennsylvania-Duits 3052 1343 100 142 74 217
Indonesisch 2709 1656 297 295 50 0
Nedersaksisch 2287 1271 94 170 75 3
Latijn 2237 881 194 247 92 419
Slowaaks 2122 1069 524 35 47 25
Pools 1678 1151 83 69 19 33
Limburgs 1614 936 87 342 69 34
Catalaans 1565 551 123 657 16 634
Vietnamees 1521 726 231 319 51 0
Portugees 1478 950 82 136 7 1
Lets 1444 714 6 3 172 0
Japans 1449 1087 53 178 25 0
Esperanto 1392 720 73 215 16 0
Hongaars 1239 619 84 105 27 4
Grieks 1140 687 52 23 9 0
Bulgaars 1093 429 18 30 5 62
klassiek Nahuatl 1038 707 26 11 11 0
Welsh 988 661 90 32 5 0
Fins 991 653 32 45 14 0
Perzisch 812 464 18 26 10 7
Iers 783 545 42 24 6 2
Fries 761 473 28 20 22 2
Oekraïens 768 522 31 27 2 0
Xhosa 738 213 8 39 12 29
Veluws 725 425 42 84 32 1
Bretons 708 337 54 71 1 0
Kroatisch 681 348 7 3 0 0
Estisch 675 335 117 0 2 0
Quechua 653 300 46 79 14 12
Koerdisch 650 387 18 29 2 122
Arabisch 641 360 49 62 4 0
Roemeens 643 370 17 40 11 0
Oezbeeks 626 374 21 6 12 0
Papiaments 608 437 30 65 14 0
Mandarijn 596 381 64 100 19 0
Oudnoords 583 243 26 197 5 5
Hindi 588 333 41 59 6 0
Luxemburgs 588 217 22 28 18 6
Chinees 578 381 2 5 2 0
Faeröers 566 214 118 52 8 0
Middelnederlands 578 323 35 161 21 22
Angelsaksisch 551 419 16 17 5 1
Occitaans 546 290 11 26 2 0
Litouws 479 296 2 4 2 0
Baskisch 474 289 29 6 4 0
Koreaans 466 332 2 3 1 0
Achterhoeks 453 264 21 19 12 1
Oudgrieks 457 272 8 29 9 0
Hebreeuws 438 294 4 3 1 0
Servisch 436 309 6 0 1 0