Inventarisering van taalsector-terminologie

taalsector-terminologie

Taalsector, taalprofessional, taalberoep, taalwerk. Vier eenvoudige termen. Iedereen begrijpt wat ze betekenen, maar hoe zeg je 'taalprofessional' in het Frans? Of 'taalsector' in het Engels?

Liesbet Van Oudenhove wou het antwoord hierop vinden tijdens haar stage bij De Taalsector. Ze verzamelde relevante terminologie over de taalsector en zocht naar een plek om de termen met de 'community of interest' te delen en te bespreken. De taalsector is levend en verandert: Je zou kunnen zeggen dat terminologie volop aan het bloeien is! Dit is het verslag van haar avontuur.

Liesbet Van Oudenhove, Gent - Eerst en vooral bezocht ik de website van De Taalsector voor een algemeen idee van de belangrijkste terminologie in de taalsector. Onmiddellijk vond ik een interessante term in de basislijn van De Taalsector: iets als 'taalprofessional' letterlijk vertaald in het Engels, maar naar wie of wat verwijst de term 'taalprofessional' nu eigenlijk precies? En hoe vertaalt u deze term in het Frans, bijvoorbeeld?

"Taalprofessional" verwijst naar iedereen die zich bezighoudt met taal voor hun werk: copywriters, taalleraren, tolken, taalingenieurs, technische schrijvers, redacteuren, geletterdheidleerkrachten, taalbeleid-coördinatoren, spraaktherapeuten, vertalers, dialectologen, lexicografen, taaltrainers, audio beschrijvers en een hele reeks van professionals die hun brood verdienen door middel van taalgerelateerd werk.

SYSTRAN, een van de MT-systemen (Machine Translation) die De Taalsector gebruikt (thelanguageindustry.eu) voor vertalingen uit het Nederlands naar het Frans, vertaalt 'taalprofessional' als 'professionnel de la langue'. Google Translate vertaalt het als 'professionnel langue'. Het is dus duidelijk dat MT-systemen problemen hebben met de term 'taalprofessional'.

Maar hoe zit het met menselijke vertalers? Om dit te bepalen, richtte ik me op verschillende internetforums en Facebookgroepen voor professionele vertalers. 'In mijn bericht vroeg ik om een Franse vertaling van 'taalprofessional' op basis van een korte tekst over de Language Industry Awards (LIA's). Ik dit bericht op zes verschillende plaatsen gepost en kreeg vier verschillende antwoorden. Een vertaler koos voor 'un professionnel de la langue', een andere 'professionnel linguistique'. Nog een andere stelde 'professionnel des langues' of 'professionnel en langues' voor. Deze term is duidelijk problematisch voor menselijke vertalers en machines.

Als 'taalprofessional' een problematische term is in het Frans, hoe zit het dan met taalwerk, taalberoep, taalproduct taaldienst en andere kernbegrippen in de taalsector? En hoe zit het met andere talen dan Frans? Vertalers hebben inderdaad een overvloed aan verschillende ideeën. Dit is op zich niet een ernstig probleem, maar het toont vooral hoe zeer de concepten kunnen verschillen waarnaar een term kan verwijzen. In ieder geval leek de hele kwestie uiteenlopender dan ik had verwacht en is het dus des te meer de moeite waard om te onderzoeken.

Allereerst wilde ik de belangrijkste termen van de taalsector in het Nederlands zo snel en efficiënt mogelijk te verzamelen. Dit werd op een aantal manieren gedaan: Ik heb handmatig gezocht naar termen op de website van de taalindustrie, heb Dries Debackere, expert in de taalsector, gevraagd om een mindmap te maken van de taalsector en vervolgens termextractietools geruikt. Dit zijn tools die automatisch termen uit een tekstcorpus halen, wat in dit geval handig was omdat het corpus van De Taalsector meer dan een miljoen woorden bevat.

Na grondig te zoeken vond ik drie termextractietools die nuttig konden zijn.

De eerste was AntConc, niet echt een termextractietool maar een concordantieprogramma. Met AntConc zocht ik naar termen en collocaties waarin de tekenreeks 'taal' verscheen. Met dit nuttige hulpmiddel kon ik snel deze termen en collocaties vinden en zien hoe vaak ze voorkwamen in het hele corpus.

Het volgende hulpmiddel dat ik probeerde was TermTreffer, van de Nederlandse Taalunie, om termen uit Nederlandse tekstcorpora te extraheren. TermTreffer is een online tool waarvoor je je moet registreren. Uw login en paswoord worden per mail opgevraagd - een tijdrovend proces. Zodra u ingelogd bent gebeurt de termextractie redelijk snel. U uploadt uw corpus en krijgt de termen onmiddellijk te zien. TermTreffer gaf 22,600 termen van onze corpus van meer dan een miljoen woorden, waaronder er geen werkwoorden leken te zijn, waardoor we kunnen afleiden dat het geen effectieve termextractietool was.

Een ander tool dat ik gebruikte was TExSIS, een tool gemaakt door de Universiteit Gent. Het was onmogelijk om het hele corpus van een miljoen woorden te uploaden, dus heb ik het corpus in tien kleinere stukken verdeeld. De resultaten kwam een paar dagen later – een lijst met 50.000 termen.

Omdat TExSIS zo veel taalsectorgerichte termen gevonden had, vroeg ik me af of extractietools in het algemeen wel betrouwbaar zijn. Ik besloot om een handmatige termextractie uit te voeren op een aantal willekeurig geselecteerde artikelen uit de website van De Taalsector. Ik heb mijn eigen woordenlijst vergeleken met de lijsten van de termextractietools die hierboven vermeld werden. De termen van AntConc hadden een 16% match met mijn manuele Termextractie. TermTreffer had maar 7% dezelfde termen. TExSIS had een beter resultaat en bevatte 50% van mijn handmatig geëxtraheerde termen, maar bevatte dan ook het meeste irrelevante woorden.

De taalsector zou niet alleen in Nederlandstalige gebieden besproken worden. De Europese taalsector heeft 24 officiële talen. Taalsectorterminologie is ook over de taalgrenzen nuttig. Vertalers en vertaalmachines moeten gemakkelijk toegang hebben tot een meertalige terminologiedatabase met taalsectorgerelateerde termen. Dit zou zeer nuttig zijn, zoals niet alleen duidelijk werd uit vertalers en hun opmerkingen op forums en discussiegroepen aantonen, maar ook de verschillende MT-systemen die op de meertalige website van De Taalsector aangesloten zijn. Dit betekent dat wij ook moeten nadenken over een bestandstype dat beheerbaar is voor zowel de vertaler als een machine. Dit type bestaat daadwerkelijk wel. Het heet TBX, maar ik ken niemand die het gebruikt.

Het zou echt nuttig als wij, als taalprofessionals, al onze taalsectorrelevante termen zouden verzamelen, beheren en delen in een ruimte waar taalprofessionals het proces kunnen verbeteren door een debat te beginnen over iedere term. Beheren, delen en bespreken op dezelfde plek.

Om zo'n ruimte te vinden onderzocht ik een aantal webgebaseerde platformen waar terminologie kan worden beheerd en gedeeld. Dit is hoe ik bij evoTerm terechtkwam, een betalend terminologiebeheersysteem waar je input helemaal je eigen blijft, waar je anderen toegang kunt geven tot je terminologiedatabanken en waar je kunt beslissen of een gebruiker is toegestaan om wijzigingen aan te brengen. De interface is beschikbaar in het Engels, Frans, Duits of Nederlands. Dit lijkt een goed systeem te zijn, maar er is geen manier om de termen te bespreken. Deze functie is uiterst belangrijk, omdat taalsectorterminologie nog nieuw en dus instabiel is.

Een ander termbeheersysteem dat ik nauw bekeken heb is TermBeheerder, ook een systeem in opdracht van de Nederlandse Taalunie en ontwikkeld door CrossLang (Gent). Dit systeem slaat je termen op (die later kunnenworden veranderd), zodat je er een heleboel contextuele informatie aan kunt toevoegen en - en dit is precies wat ik zocht en wat de taalsector, naar mijn mening, nodig heeft - andere gebruikers gemakkelijk opmerkingen kunnen toevoegen en discussies kunnen starten. Jammer genoeg is dit webgebaseerde tool is nog in een beta-versie! Ik heb sommige termen geüpload, maar niemand kan ze op dit moment gebruiken of wijzigen. Het is ook jammer dat de interface alleen in het Nederlands kan worden getoond. Als we een meertalige interface zouden kunnen creëren, zou TermBeheerder een geweldige meertalige omgeving zijn waarin je termen kunt verzamelen en beheren, maar er ook discussies over kunt beginnen.

Conclusie: er is nog een heleboel werk aan de winkel. Er is een behoefte een een plek waar taalprofessionals in verschillende talen met elkaar kunnen debatteren over hun eigen terminologie. Deze ruimte zou bij voorkeur op dezelfde locatie zijn waar de terminologie wordt beheerd en gedeeld.

 

Zou u graag reageren op dit artikel? Stuur gerust een e-mail naar liesbet.vanoudenhove@detaalsector.be .

 

http://www.termbeheerder.org/

http://www.termtreffer.nl/

http://www.evoterm.net/

http://www.thelanguageindustry.EU/

 

 


Powered by CrossLang

Auteur: Liesbet Van Oudenhove

Machinevertaling: SDL BeGlobal

Post-editing: Quick Post-Editor 7

Brontaal: English (en)


Aanvullende gegevens

Cron Job Starts