WikiWoordenboek:Widawiwo/Gegevensmodel

Uit WikiWoordenboek

Deze pagina met subpagina's dient voor de verkenning van het gegevensmodel van Wikidata zoals dat van belang is voor het project. Hieronder staan kopjes met eigenschappen (properties) die overeenkomen met kenmerken die we in WikiWoordenboek gebruiken, ruwweg in de volgorde waarin ze in het stramien van een Nederlands woord voorkomen.

Als een eigenschap uitsluitend bij een bepaalde woordsoort voorkomt, is dat direct onder het kopje aangegeven. Verder staat daar met welk sjabloon de eigenschap correspondeert en wat voor waarden deze eigenschap kan aannemen.

Deze pagina bevat bewust niet alle mogelijke eigenschappen. Het gaat om eigenschappen waarvan aannemelijk is dat ze vrij gemakkelijk voor grote aantallen woorden beschikbaar zijn te krijgen. Eigenschappen die niet zo vaak voorkomen (minder dan pakweg 1000 keer) of die meer specifieke aandacht vragen voordat ze verwerkt kunnen worden kunnen beter in de toekomst worden opgepakt. Zo blijft het project hanteerbaar.

Aanpak[bewerken]

Hieronder staan links naar per woordsoort (lexical categories). Op elk van die pagina's staat een lijstje links naar Nederlandstalige lexemen die onder die woordsoort vallen. De bedoeling van de verkenningsfase is dat al deze woorden op Wikidata zo compleet mogelijk worden gemaakt. Hierbij kan duidelijk worden of onderstaande lijst van eigenschappen bruikbaar is: -ontbreken er eigenschappen die goed kunnen worden toegevoegd; -staan er eigenschapen op die toch beter later kunnen worden opgepakt; -wat zijn de mogelijke waarden die een eigenschap kan krijgen; -welke qualifiers zijn van toepassing; -zijn er nadere afspraken nodig om ondubbelzinnig met deze eigenschappen en waarden te kunnen werken.

De simpelste werkwijze is om een lexeem uit te breiden en op deze pagina onder de kopjes aan te geven als je problemen tegenkomt. Het is de uitdrukkelijk de bedoeling niet alleen het lexeem zelf, maar ook alle bijbehorende woordvormen en betekenissen toe te voegen en te beschrijven. Dit is nog best een klusje, omdat op dit punt de structuur van Wikidata en WikiWoordenboek verschillend is. Wanneer je een lexeem hebt afgemaakt is het handig om achter de link op de subpagina je handtekening te zetten, om dubbel werkt te voorkomen. Je kun zo eventueel ook laten weten dat je nog met een lexeem bezig bent. Wie een beetje thuis is in Wikidata en WikiWoordenboek is welkom om een bijdrage te leveren.

Het toevoegen van nieuwe lexemen met de hand is geen feest. Als je een zelfstandig naamwoord wil toevoegen besparen onderstaande formulieren een beetje tijd, door meteen de woordvormen aan te maken. Dan blijft er trouwens nog genoeg handwerk over. Je kunt aan de hand van woordgeslacht nu uit vier mogelijke formulieren voor zelfstandige naamwoorden kiezen. Andere woordsoorten met meer vormen (werkwoorden en bijvoeglijke naamwoorden) onderzoek ik nog.

Ik kwam ook afspraken op Wikidata over Nederlandse lexemen tegen, waar ik al wat aan heb gewijzigd/toegevoegd.

Woordsoortenlijstjes[bewerken]

Uit de rode links, maar ook uit de lengte van sommige lijstjes valt zonder meer de conclusie te trekken dat het van belang is nog een aantal voorbeeldlexemen toe te voegen om een redelijk beeld van de (on-)mogeljkheden te krijgen.

Gegevensmodel[bewerken]

Wiki woordenboek Lexemes 20190526 - eigenschappen

Eigenschappen[bewerken]

Lexeem lemma = [paginatitel][bewerken]

Lexeem taal = nl[bewerken]

Betekenissen P18 [afbeelding][bewerken]

  • Niet zinvol bij lidwoorden.

Lexeem lexicale categorie = woordsoort[bewerken]

Vormen P443 [geluidsbestand][bewerken]

  • Vooralsnog heb ik de standaardweergaven gekwalificeerd met
P407 taal van werk of naam Q36423 taal van werk of naam

Vormen P898 [IPA][bewerken]

  • Vooralsnog heb ik de standaardweergaven gekwalificeerd met
P407 taal van werk of naam Q36423 taal van werk of naam
  • Als je de waarde uit {{IPA-nl-standaard}} voor het hoofdlemma gebruikt, is als bron nu het "Uitspraakwoordenboek" beschikbaar:
P248 vermeldt in Q64290453 Uitspraakwoordenboek (geldt niet voor de verbogen vormen)

Vormen P5279 [afbreking][bewerken]

Lexeem P5191 met P5886 [etymologie][bewerken]

Lexeem P5186 [vervoegingsklasse] (alleen bij werkwoorden)[bewerken]

Lexeem P5185 [woordgeslacht] (alleen bij zelfstandige naamwoorden en eigennamen)[bewerken]

  • In het Nederlands zijn er heel wat woorden die van oorsprong vrouwelijk zijn, maar die geleidelijk aan steeds meer als mannelijk worden gebruikt. Ik ben nog een beetje met kwalidficaties aan het stoeien om dat goed te beschrijven: Q1775415 "vrouwelijk woordgeslacht" P156 "gevolgd door" Q499327 "mannelijk woordgeslacht". Na overleg op Wikidata heb ik een nieuw item, speciaal voor het Nederlands gemaakt:
    (wikidata: v/m op Wikidata)
    dat in plaats van en kan worden gebruikt.--MarcoSwart (overleg) 7 jun 2019 18:01 (CEST)[reageren]

Lexeem P5713 mogelijk woordgeslacht (alleen bij bepaald lidwoord)[bewerken]

Betekenissen.nl.glos = [betekenis][bewerken]

Betekenissen P5137 (bij aardrijkskundige namen en biologische soorten)[bewerken]

Betekenissen P5526 [onpers, ov, erga, inerg] (bij werkwoorden)[bewerken]

Vormen.Grammaticale eigenschappen = (zit meestal in sjablonen)[bewerken]

werkwoorden
onbepaalde wijs
tegenwoordig deelwoord
tegenwoordig deelwoord, verbogen vorm
stam, 1e persoon, 2e persoon bij inversie, gebiedende wijs
2e persoon, 3e persoon
onvoltooid verleden tijd enkelvoud
onvoltooid verleden tijd meervoud
voltooid deelwoord
aanvoegende wijs
zelfstandig naamwoord
enkelvoud
meervoud
verkleinwoord enkelvoud
verkleinwoord meervoud
Het lijkt praktischer de verkleinwoorden als regel op het lexeem van het hoofdlemma toe te voegen en voor de gevallen waarin het verkleinwoord een specifieke betekenis heeft een apart lexeem aan te maken.
eigennaam
bezitsvorm
bijvoeglijke naamwoord
stellende trap
stellende trap, verbogen vorm
stellende trap, partitief
vergrotende trap
vergrotende trap, verbogen vorm
vergrotende trap, partitief
overtreffende trap
overtreffende trap, verbogen vorm

Gewenste entiteiten[bewerken]

voor bronnen[bewerken]

woordenlijst.org
WNT
etymologiebank

Zinvolheid en problemen nog nagaan[bewerken]

Vormen P1683 [voorbeeldzinnen][bewerken]

Betekenissen P... [synoniem][bewerken]

Betekenissen P... [antoniem][bewerken]

Betekenissen P... [hyperoniem][bewerken]

Betekenissen P... [hyponiem][bewerken]

Betekenissen P... [gerelateerd][bewerken]

Betekenissen P... [verwijzingen][bewerken]