Naar inhoud springen

Gebruiker:PolyBot

Uit WikiWoordenboek

Dit is de pagina voor de robot van Polyglot.

Ik zit al maanden te broeden op dit idee.

M.b.v het pyWikipediaBot framework krijgt het nu eindelijk vorm.

De hoofdbedoeling van de robot is het overzetten van lemma's/woordenboekingangen van de ene taalwiktionary naar de andere. Uiteraard is het zo dat als hij dat eenmaal kan, hij ook WikiWoordenboekingangen kan bijwerken en standaardiseren binnen één Wiktionary.

Alle begin is moeilijk, dus in eerste instantie is dit niet haalbaar. Op termijn is het wel de bedoeling om te beginnen bij een pagina, op te zoeken welke de tegenhangers zijn op de andere Wiktionary's (als ze bestaan kunnen er al Interwiktionary links aangemaakt worden), de links naar de vertalingen op hun oorspronkelijke Wiktionary's te volgen en na te kijken of de vertalingen overeen komen.

Doen ze dat niet, dan wordt dit voorgelegd aan de operator die dan kan beslissen of ze mogen worden toegevoegd.(Het zal wat mij betreft altijd een interactieve robot zijn)

Hoe werkt het?

[bewerken]

Om te beginnen wordt een WikiWoordenboekingang opgeslagen onder de vorm van objecten:

  • WiktionaryEntry -> een pagina voor een bepaalde spelling
  • SubEntry -> een blok op een pagina die een lemma in een bepaalde taal beschrijft
  • Meaning -> één van de betekenissen voor dit lemma
  • Term -> Termen/Lemma's/Uitdrukkingen in dezelfde of een andere taal waarnaar verwezen wordt (die dus doorverwijzingen zullen worden)

Een WiktionaryEntry bevat dus meerdere SubEntry objecten. Een SubEntry bevat meerdere Meaning objecten. Een Meaning object maakt gebruik van Term objecten voor synoniemen, vertalingen, Gerelateerde woorden etc.

Een Term object heeft meerder subklassen voor de woordsoorten.


Om te beginnen werk ik aan een manier om van al deze objekten een WikiWoordenboekingang te maken, waarbij de standaarden van de verschillende Wiktionary's gerespecteerd worden. (Op dit moment concentreer ik me op de Nederlandse en de Engelse, maar ik zorg ervoor dat het vlot uitbreidbaar is naar de andere taalversies)

Later zal ik proberen om a.d.h.v echte Wikitionary-pagina's deze objectenstructuur op te vullen. Ofwel rechtstreeks on line, ofwel vanuit een SQL-dump.

Het eerste wat ik wil gedaan krijgen met deze robot is het invoeren van de namen van alle landen in 6 talen.

Alvorens te starten, zal ik de robot een tweetal pagina's laten aanmaken. Waarna ik zal wachten op commentaar om de robot bij te regelen.

Het zou nog een paar dagen of weken kunnen duren voordat ik hiermee begin. Iedereen kan 's een blik gaan werpen om te zien hoever ik al sta:

http://cvs.sourceforge.net/viewcvs.py/pywikipediabot/pywikipedia/wiktionary.py?rev=1.10&view=log

Polyglot 10 dec 2004 16:11 (UTC)