WikiWoordenboek:Taalnamen

Uit WikiWoordenboek

Voorgeschiedenis[bewerken]

Het begon met een handige tabel met de officiële talen van de Europese Unie. Op de Nederlandse, Engelse en Franse Wiktionary's staat al een dergelijke tabel. Hierin was de toetreding van Bulgarije en Roemenië nog niet verwerkt. Daarom maakte ik een complete en Nederlandse nieuwe versie gemaakt.

Nogal wat velden en soms hele kolommen bleven dieprood. Soms omdat de betreffende namen van talen nog niet in WikiWoordenboek voorkwamen. Maar consistentie bij de spelling van namen van talen bleek een nog veel frequenter probleem te zijn: vooral het gebruik van hoofdletters voor de namen van talen bleek af te wijken van de conventies die zowel de MetaWiki, zuster-Wiktionaries/Wikipedia's in de betreffende taal als de EU hanteerden. In dat geval wordt het betreffende lemma dus gewoon niet teruggevonden. Schrale troost: het was bij de Franse en Engelse Wiktionary niet veel beter.

Ging het alleen om het tabelletje, dan zou je je schouders nog kunnen ophalen. Maar de namen van talen worden logischerwijs nogal veel gebruikt bij verwijzingen. Het is erg storend als die soms niet kloppen. De zoekfunctie weet nog aardig raad met verkeerde hoofdletters of kleine letters; alleen als beide lemma's voorkomen is het echt belangrijk om precies in te typen wat je zoekt. Maar bij de interne links is een spelfout gewoon fataal. Het vervelende is dat consistentieproblemen vaak de neiging hebben steeds venijniger te worden naarmate een systeem groeit. Het leek me dus zaak er nu iets aan te gaan doen. Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]

Aanpak[bewerken]

Enige verkenning van het probleem door wat rondvragen, rondkijken en kleinere correcties heeft me tot de volgende benadering van dit project gebracht.

  1. Anders dan ik in het begin hoopte laat dit vraagstuk zich niet eenvoudig automatiseren. De naam van een taal kan in verschillende talen helemaal gelijk zijn, of juist alleen verschillen in het gebruik van hoofdletters. Een onjuist gespelde naam van een taal kan een geldig woord opleveren, mogelijk weer in een andere taal. Er zit ook maar in beperkte mate een patroon in de inconsistenties. En er zijn alleen al in de EU drie verschillende alfabetten bij betrokken.
  2. Het gesignaleerde probleem treedt evengoed op bij de namen van talen buiten de EU. Een strikte beperking tot de vakjes van de tabel is maar een bescheiden bijdrage aan een meer consistent WikiWoordenboek.
  3. Een te alomvattende benadering loopt weer het risico in schoonheid te sterven. Er zijn domweg teveel talen en Wiki is een open project dat je niet even stil kunt zetten.
  4. Er zijn gelukkig tot nu toe nog geen tegenstrijdige conventies over het spellen van namen van talen tussen MetaWiki, de EU en de Wiktionary/Wikipedia in de betreffende taal. Uiteraard zijn conventies uit deze bronnen niet altijd voor alle talen beschikbaar. Maar het vertrekpunt is simpel: in iedere taal worden de spellingregels van die taal gevolgd. Dus in het Nederlands (Engels, Duits en nog een paar) krijgen namen van talen een hoofdletter, maar in de meeste talen niet.
  5. Een paar simpele verschrijvingen en een kleine reeks ontbrekende namen van talen in de tabel waren al snel opgelost. Iets subtieler waren de gevallen waarin een vakje in de tabel wel blauwe tekst bevat, maar het om een homoniem blijkt te gaan dat een manco verbergt. Ook deze situaties zijn allemaal uitgezocht.
  6. Naar aantallen correcties zit het probleem vooral bij een aantal talen waarin namen van talen niet met hoofdletters worden gespeld, maar WikiWoordenboek dat wel heeft gedaan. Daarom ben ik maar begonnen om in die talen alle namen van talen alsnog om te zetten naar kleine letters (dus zowel voor talen binnen als buiten de EU). Ik begin met de officiële talen van lidstaten van de EU en ga daarna naar de talen daarbuiten in de weer. Ik denk nog na over een handige aanpak.

Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]

Stand van zaken[bewerken]

[x] Bulgaars Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]

[x] Estisch Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]

[x] Grieks Stuart LaJoie overleg 28 feb 2007 21:23 (CET)[reageer]

[x] Lets Stuart LaJoie overleg 2 mrt 2007 21:57 (CET)[reageer]

[x] Litouws Stuart LaJoie overleg 6 mrt 2007 00:06 (CET)[reageer]

Nieuwe vraagstukken[bewerken]

  1. Van een aantal talen heb ik inmiddels de indruk dat het niet vanzelfsprekend is dat de naam van een taal met één woord wordt aangeduid. Van het Fins, Pools en de drie Baltische talen krijg ik sterk de indruk dat wat wij 'Engels' noemen, in die talen eigenlijk met 'Engelse taal' moet worden aangeduid om misverstanden te voorkomen. Mijn kennis van de betreffende talen schiet nog tekort om deze vraag stellig te kunnen beantwoorden, maar dit zou een tweede ronde aanpassingen kunnen pleveren. Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]
Wat het Fins en de Baltische talen betreft weet ik het niet, maar voor het Pools is het inderdaad formeel correct om język angielski (let. taal Engels) te schrijven. Het is echter niet ongebruikelijk, met name in de spreektaal, język weg te laten. Vaak wordt er ook gekozen om het als volgt af te korten: j. angielski. Dit is wellicht voor de tabel een goede optie. Raymondm 6 mrt 2007 21:01 (CET)[reageer]
  1. Namen van talen worden nu eens tot de zelfstandige naamwoorden en dan weer tot de eigennamen gerekend. Stuart LaJoie overleg 28 feb 2007 05:47 (CET)[reageer]
  2. Ook de tabellen met vertalingen moeten worden aangepast. Dit lijkt me een klusje om aan het eind ineens te doen. Stuart LaJoie overleg 2 mrt 2007 01:07 (CET)[reageer]
  3. Bij het alfabetiseren binnen categorieën worden de woorden die beginnen met de hoofdletter van sommige specifieke Oost-Europese diakrieten niet apart vooraan gezet, maar net voor die met de kleine letters van de betreffende diakriet. Dit zit vermoedelijk wat dieper in de programmatuur verborgen, maar ik wil nog eens uitzoeken hoe de Wiktionary's in de betreffende landen daarmee omgaan. Stuart LaJoie overleg 5 mrt 2007 20:35 (CET)[reageer]