Overleg WikiWoordenboek:Transtool

Uit WikiWoordenboek
Ga naar: navigatie, zoeken
Subpagina's:
archief

probleemcodes
testen

Op deze pagina kan uitgebreid gediscussieerd worden over Transtool

Enige van de vragen en discussies over Transtool liepen op verschillende pagina's en zijn hier nu samengebracht in één discussiedraad. De ontwikkeling van Transtool is nog gaande, het programma werkt dus nog niet voor volle 100%. Help mee Transtool te verbeteren door je bevindingen hier te plaatsen. Heb je nog meer opmerkingen en ideeën over Transtool, uit ze dan ook gerust hier. Wil je meer weten over de werking kijk dan hier (Transtool werking).


Inhoud

top/mid/bottom [bewerken]

Het is nu voor het Nederlands nog mogelijk om met Transtool vertalingstabellen met de sjablonen top, mid en bottom aan te maken. Dit zou voorkomen moeten worden want het levert onbruikbare resultaten op. Tussen haakjes, de computerecho in Transtool zou best uitgezet worden. Want hij levert (vele) lijnen met words: op die de meeste gebruikers in de war brengen en extra scrollen nodig maken. Jan 31 dec 2006 18:13 (CET)

Weet ik, maar ik geraak niet op de toolserver. Zal wegens technische redenen maar voor de 2de januari zijn. Annabel(overleg) 31 dec 2006 18:19 (CET)
Oké, de computerecho is verdwenen in de nieuwste Transtoolversie. De standaardwaarde voor de sjablonen die het begin, midden en einde van de vertalingen aanduiden is nu voor het Nederlands {{(}}, {{-}} en {{)}}. Dat lijkt me een betere keuze dan {{trans-top}}, {{trans-mid}} und {{trans-bottom}} (even und wijzigen in en aub) met zijn te kleine lettergrootte en slecht leesbare opties Toon en Verberg.
Jammer genoeg blijkt voor het Nederlands nog steeds de optie {{top}}, {{mid}} en {{bottom}} mogelijk, al leidt die tot ongewenste resultaten omdat top en mid nu als taalcodes worden geïnterpreteerd. Jan 5 jan 2007 10:56 (CET)
Tja, dat van die und is een typische knip-en-plak-schoonheidsfout. Deze zal er uitgaan van zodra ik op de toolserver geraak.
Ik kan de optie voor {{top}}, {{mid}} en {{bottom}} er in de Nederlandse versie uithalen, maar dan heb je inconsistentie met de andere interfaces (de, en). Alles is op dat vlak mogelijk, maar wat het beste is ... Annabel(overleg) 5 jan 2007 21:43 (CET)

Van {{trad|tl|woord}} naar [[woord]] [bewerken]

Transtool heeft weinig problemen om vertalingen volgens het Engelse systeem om te zetten naar vertalingen volgens het trad-systeem met zijn typische koppelingen naar anderstalige Wiktionary's. Een vertaalstring als *Dutch: [[woord]] wordt netjes geconverteerd naar :*{{nl}}: {{trad|nl|woord}} (met tweelettercode) of :*{{nld}}: {{trad|nl|woord}} (met drielettercode).
Bij een omgekeerde conversie van het trad-systeem naar het Engelse systeem gaat het voorlopig mis: zowel :*{{nl}}: {{trad|nl|woord}} als :*{{nld}}: {{trad|nl|woord}} worden geconverteerd naar *Dutch: {{trad|nl|woord}}, ook als Transtool staat ingesteld op [[word]]-resultaten. Bovendien schijnen veel Engelstalige wikiwoordenaars niet van het trad-systeem te houden. Enfin, blijkbaar moet Transtool leren om van het trad-sjabloon alleen de tekenreeks tussen de laatste | en het afsluitende }} over te houden en die tussen [[ en ]] te zetten. Jan 5 jan 2007 11:28 (CET)

Laat maar lekker misgaan zou ik zeggen, moeten die anglo's maar taalcode's gaan gebruiken: ze zijn op dat soort punten een beetje asociaal. Alles en iedereen moet zich altijd naar hen richten. Jcwf 5 jan 2007 15:45 (CET)
Tiens, deze moet ik eens grondig bestuderen. Annabel(overleg) 5 jan 2007 21:54 (CET)
Neem je tijd. Op het eerste gezicht lijkt het makkelijk: gewoon wat ongewenste tekens weghalen. Maar misschien is het niet iets om even tussen de soep en de patatten te fiksen. Als je meer uitleg wenst, laat dan maar weten. Succes! Jan 5 jan 2007 22:02 (CET)
Ik heb het gevonden! De ondersteuning voor 3-letter codes was zo'n dramatische verandering, dat de code moest uitgemest worden. Een deel van de code was naar een subfunctie verhuist, waardoor een variabele niet meer gedeclareerd werd. En ja, een scriptingtaal zoals PHP reclameert natuurlijk niet in zo'n situatie, met als gevolg deze rare resultaten. Ik zal nog een seintje geven wanneer ik het geupload heb (eerst nog op de toolserver geraken). Annabel(overleg) 5 jan 2007 22:18 (CET)

Praktische benadering voor niet-ondersteunde talen [bewerken]

Als Transtool een onbekende taal(code) tegenkomt, wordt de bewuste regel zonder enige bewerking onder het kopje Niet ondersteunde talen gedumpt, dat onderaan in het outputvak komt te staan. Uiteraard mag je niet verwachten dat Transtool op (heel) korte termijn alle (Nederlandse en Engelse) taalnamen en taalcodes herkent. Maar er zijn in afwachting wel enkele handige verbeteringen mogelijk:

  1. De niet-herkende talen worden BOVENAAN in het outputvak geplaatst, liefst in alfabetische volgorde. Zo hoef je niet (herhaaldelijk) naar beneden te scrollen om te controleren of er (nog) niet-ondersteunde talen zijn, want je probeert oplossingen voor die talen te vinden.
  2. Ook als Transtool een taal niet herkent, zorgt hij in het resultaat toch voor de lay-out die door de gebruiker is gekozen. Een tekenreeks als *Tok Pisin: [[bulmakau]] wordt door Transtool gedumpt als Tok Pisin: [[bulmakau]], ook als je qua lay-out hebt gekozen voor het trad-sjabloon. Merk ook op dat Transtool het sterretje vóór de taalnaam heeft verwijderd. Je kunt in het invoervak zelf Tok Pisin vervangen door {{tpi}} en de dumpregel zal dan juist geïnterpreteerd worden door WikiWoordenboek, want die kent tpi wel. Alleen zou Transtool dan wat moeten meewerken door de vertaling in het gevraagde trad-sjabloon te geven en niet in het originele formaat, dus :*{{tpi}}: {{trad|tpi|bulmakau}}. Anders moet je alle vertalingen in niet-herkende talen zelf herschrijven :-( Jan 5 jan 2007 15:10 (CET)
De niet-ondersteunde talen zullen in de volgende versie bovenaan komen in de volgorde zoals ze in de brontekst voorkwamen. Er zal een scheiding zijn door middel van liggende streepjes met de gewenste wiki-code. Annabel(overleg) 5 jan 2007 22:20 (CET)
Hmmm Jan, Je tweede suggestie ligt nogal moeilijk. Ik ga ervan uit dat als een taal niet herkend wordt, dat je niet weet waar hij bijvoorbeeld ergens in het alfabet thuishoort. <hulp gevraagd> Bovendien kan je niet garanderen dat je de juiste naam van de taal hebt. Wat is in zo'n geval dan het beste
  1. wanneer de taalnaam voluit geschreven is
  2. wanneer er een taalsjabloon gebruikt werd
ik kan er wel voor zorgen dat ":*" vooraan de regel wordt toegevoegd, maar dit kan rare resultaten geven als iemand de "lay-out-string" verkeerd invult.
Annabel(overleg) 5 jan 2007 22:30 (CET)
Inderdaad, er kunnen zich allerlei problemen voordoen. Trouwens, als ik een dumpregel niet vertrouw, laat ik hem gewoon weg! Ik heb daarnet nog de taalcode moeten zoeken van een bijna uitgestorven Aboriginaltaal, en voor de zekerheid zoek ik die niet hier, maar op de Ethnologue-site. Als de taalnaam voluit is geschreven: dan die string behouden, zeker niet proberen om te zetten naar een code. Idem voor een taalcode: de taalcode behouden en zeker niet omzetten naar een taalnaam, want waarschijnlijk gaat het om een taal die ontbreekt in je database. Ook verwacht ik niet dat je een niet-herkende taal tussen de wel-herkende rangschikt, ze moeten apart blijven en - indien mogelijk - de gedumpte talen in alfabetische volgorde, desnoods volle naam en taalcode door elkaar. Ik zet ze wel op hun juiste plaats (en pas eventueel de lay-out aan door het middensjabloon wat te verplaatsen). Maar ook belangrijk is dat de vertaling in het gewenste formaat wordt gegeven, dat bespaart ons dom werk. Inclusief toevoeging van een niet-herkende taalcode in het trad-sjabloon, maar een nulstring bij een onafgekorte taalnaam! Jan 5 jan 2007 22:53 (CET)
Ik zal zien wat ik kan doen. Overigens, zal de volgende versie nog een langverwacht verzoeknummer bevatten. De lay-out is aangepast zodat bron en doel in 2 kolommen naasteen staan. Annabel(overleg) 5 jan 2007 23:18 (CET)
De nieuwe versie (zonder de suggesties voor de dumpregels) is geupload. Annabel(overleg) 7 jan 2007 11:58 (CET)
Versie met herwerking van dumpregels is nu geupload. Annabel(overleg) 19 jan 2007 21:52 (CET)
De nieuwste versie met lay-out met twee kolommen, standaard ISO 639-3 ondersteuning en niet ondersteunde talen alvast in een sjabloon gezet, werkt wel lekker. Het belangrijkste is nu nog denk ik een completere ondersteuning van talen. Hierna kunnen natuurlijk andere wiki's beter ondersteund worden en vele details (zie testen) uitgewerkt worden. Op het ogenblik krijg ik bijvoorbeeld bij het converteren van twee het volgende resultaat:'''Niet ondersteunde talen''': :*{{jbo}}: {{trad||re}} :*{{jiv}}: {{trad||jímiar}}, {{trad||hímyar}} :*{{ktu}}: {{trad||zole}} :*{{tpi}}: {{trad||tupela}}. Eigenlijk moet hier slechts twee dingen gedaan worden, namelijk dat de taalcode ook binnen het trad-sjabloon geplaatst wordt en dat de talen op de juiste alfabetische plek komen in de lijst. Is dit binnenkort te verwachten? Raymondm 20 jan 2007 20:05 (CET)
Niet lang. Ik zou maar eens een kijkje nemen... ;-) Annabel(overleg) 20 jan 2007 20:42 (CET)
Dat is inderdaad heel rap. Mijn complimenten. Raymondm 20 jan 2007 20:52 (CET)


vanuit andere brontalen [bewerken]

Er stond dat het alleen vanuit eng, deu, fra en nld kon maar dat is echt ongepaste bescheidenheid: er zijn veel meer wikti's die een of andere vorm van ISO gebruiken en die vrij goed als brontaal gebruikt kunnen worden:

brontaal status werkt wel/niet
Afrikaans gebruikt ISO trad = vert of vertxx wel
Chinees gebruikt ISO wel (geloof ik)
Fins gebruikt ISO, weinig problemen wel
Grieks gebruikt ISO trad = ξεν wel
Hindi gebruikt ISO soms met {{fr}} wel geeft extra rommel
Hongaars gebruikt ISO, maar in en2, fr3 formaat niet zonder meer
IJslands gebruikt ISO, maar werkt met nummertjes gedeeltelijk
Indonesisch gebruikt gedeeltelijk ISO, erg weinig vertalingen niet erg duidelijk
Japans gebruikt ISO in een soort trad sjabloon (lang2) niet zonder meer
Koerdisch gebruikt ISO, weinig problemen wel
Latijn gebruikt wel ISO maar regelopmaak is anders niet
Noors gebruikt Noorse namen niet
Pools is afgestapt van ISO en gebruikt Poolse namen niet
Portugees gebruikt ISO, trad sjabloon heet xlatio wel
Roemeens gebruikt ISO, maar heeft een eigenzinnig trad sjabloon gedeeltelijk
Russisch gebruikt ISO, weinig problemen wel
Spaans gebruikt ISO, gebruikt trad wel
Tsjechisch gebruikt ISO, heeft een eigen trad sjabloon {{P|en|xxx}} wel
Turks gebruikt ISO, maar met nummertjes trad = çeviri gedeeltelijk
Zweeds gebruikt Zweedse namen niet
Misschien heb je wel gelijk. :-) De aanduiding van brontalen, duidt op een gegarandeerde ondersteuning, zowel voor ISO-codes als talen die voluit geschreven zijn. Annabel(overleg) 9 jan 2007 10:13 (CET)