Categories: Actueel

Online tool vertaalt namen uit het Russisch

Het omzetten van namen vanuit het cyrillisch naar het Nederlands is relatief gemakkelijk: daarvoor bestaat een regelsysteem waarvan de basis in 1913 is gelegd door de Leidse hoogleraar Nicolaas van Wijk (1880-1941). Onderzoeker Pepijn Hendriks : "Dat gaat in principe letter voor letter, waarbij een slavist weet waar hij op moet letten." Maar lang niet iedereen spreekt Russisch.

"Omdat het nieuws vaak via buitenlandse persagentschappen bekend wordt, vind je in Nederlandse media ook schrijfwijzen die eigenlijk uit een andere taal komen, vooral uit het Engels. Sommige redacties werken voor dat laatste wel met transcriptiemodellen, maar dat gaat lang niet altijd goed. Ook al doordat er in het Engels niet één standaardmanier is om namen om te zetten."

Snel of betrouwbaar

In de nieuw ontwikkelde Transcriptor kun je als gebruiker Russische namen in het cyrillisch of een Engelse variant invoeren, om vervolgens een spellingadvies te krijgen. Daarbij is rekening gehouden met journalisten die haast hebben: je kunt namelijk kiezen tussen een snelle en een uitgebreide variant.

Cyrillische invoer is het betrouwbaarst: die wordt volgens de transcriptie van Van Wijk snel omgezet. Bij een ‘Engelse’ invoer wordt het ingewikkelder: omdat in die schrijfwijze informatie verloren kan zijn gegaan, is niet altijd duidelijk wat de oorspronkelijke versie was. De snelle variant probeert die zo goed mogelijk te bepalen. "Maar honderd procent zekerheid biedt deze methode niet", aldus Hendriks. "Neem de verwante namen Наталья en Наталия, die moeten in het Nederlands Natalja en Natalia worden. Maar uit het Engelse Natalia kun je niet afleiden welke van de twee het zou moeten zijn."

Gezond verstand

De uitgebreide methode, ontwikkeld door Martin Reynaert, doet een groter beroep op je geduld: het kan wel enkele minuten duren voor je een resultaat krijgt. In de tussentijd wordt een grote database met persoonsnamen (JRC-Names) of aardrijkskundige aanduidingen (GeoNames) geraadpleegd en berekend welke bekende naam of aanduiding het best past bij je invoer. Overigens geeft Hendriks te kennen dat ook deze manier niet altijd foutloos is. Vooral de JRCNames-database, opgezet door onderzoekers van de Europese Commissie, bevat soms wat ruis. "Je moet dus eigenlijk in alle gevallen je gezonde verstand blijven gebruiken."

Ondanks de beperkingen hoopt Hendriks dat veel mensen dankbaar gebruik zullen maken van de Transcriptor. De tool is in korte tijd ontwikkeld, en dient als pilot voor een grotere aanvraag, om ook andere talen met een cyrillisch alfabet om te zetten, zoals het Oekraïens en het Kazachs. "En als je verder kijkt, zie je dat er ook veel variatie voorkomt bij het omzetten van Arabische namen in het Latijnse alfabet. Ook daarvoor kan een dergelijke tool uitkomst bieden."

Stel je komt in een Engelse tekst een Iaroslav Shcherbatyi tegen uit de Russische stad Chelyabinsk. Hoe schrijf je dit dan in correct Nederlands? Die vraag stond in het begin van dit artikel. Het antwoord is Jaroslav Sjtsjerbaty uit Tsjeljabinsk.

De ontwikkeling van de Transcriptor is mogelijk gemaakt door een subsidie van het programma Creatieve industrie – Kiem, aangevraagd door Nicoline van der Sijs, met als partners, naast het Meertens Instituut, de Radboud Universiteit, de Nederlandse Taalunie, VRT, NOS, het Genootschap Onze Taal, ANP en DecoType. De tool is ontwikkeld door Pepijn Hendriks en Martin Reynaert (Centre for Language and Speech Technology, Radboud Universiteit). De Transcriptor is gebaseerd op een bij Tilburg University ontwikkeld CLAM webservicesysteem waarop Matje van de Camp van het bedrijf De Taalmonsters de webapplicatie heeft gebouwd.

Redactie Engineersonline

Recent Posts

De Fransen introduceren een e-bike zonder … accu

De Pi-Pop is een e-bike zonder de gewone energiecellen. Hij werkt op kracht zonder lithium-ion,…

1 dag ago

Kwantumuitdaging wordt anderhalve kilometer onder de grond opgelost

Straling vanuit de ruimte is een uitdaging voor kwantumcomputers, omdat hun rekentijd beperkt wordt door…

1 dag ago

Max van Haastrecht nieuwe directeur KSB Nederland

Na meer dan 40 jaar voor KSB te hebben gewerkt, gaat directeur Nico Gitz binnenkort…

1 dag ago

3T Electronics & Embedded Systems breidt uit met nieuwe locatie in Drachten

3T Electronics & Embedded Systems, onderdeel van de Kendrion Group, heeft een nieuwe locatie in…

1 dag ago

Beveiligingssysteem schiet onbekenden de tuin uit met paintballs – of traangas (video)

Een nieuw huisbeveiligingssysteem schiet indringers de tuin uit met paintballs of traangas. Het is te…

1 dag ago

7 projecten krijgen subsidie voor de productie van volledig hernieuwbare waterstof

Om ervoor te zorgen dat er steeds meer hernieuwbare waterstof wordt geproduceerd in Nederland en…

1 dag ago