EO

Nieuwe methode helpt Google Translate aan betere vertaling

02 november 2014 om 14:54 uur - Amsterdam

Hoe weet Google Translate welke woorden de beste vertaling vormen van een bepaalde zin? Een team van UvA-onderzoekers ontwikkelde een nieuwe methode om computervertaalsystemen, zoals Google Translate, een handje te helpen. Met deze methode kunnen de juiste woordvormen worden gekozen in bepaalde grammaticaal complexe talen, zogeheten morfologisch rijke talen zoals het Duits. Dit gebeurt door de zinsopbouw en naburige woorden in de brontaal te analyseren, wat een betere vertaling tot gevolg heeft.


De resultaten van hun onderzoek presenteerden de onderzoekers op het toonaangevende internationale congres ‘Empirical Methods in Natural Language Processing' (EMNLP 2014) in Qatar.

Wetenschappers zijn continu bezig om het vinden van de juiste vertaling voor een computervertaalsysteem eenvoudiger te maken. Bij sommige talen is dat namelijk zeer moeilijk, bijvoorbeeld wanneer de taal waar je naar wil vertalen (doeltaal) grammaticaal ingewikkelder is dan de te vertalen taal (brontaal).

 

De UvA-onderzoekers richtten zich specifiek op morfologisch rijke talen. Dit zijn talen die veel verschillende woordvormen per woordgroep kennen. Waar het Nederlands bijvoorbeeld de woordgroep ‘de man' heeft, kent het morfologisch rijkere Duits meerdere woordvormen voor deze zelfde woordgroep: ‘der Mann', ‘des Mannes', ‘dem Mann' en ‘den Mann'. De juiste vorm hangt af van de grammaticale functie van het woord in de zin. Bij het vertalen van een zin van het Nederlands naar het Duits, zal een menselijke vertaler die beide talen spreekt gemakkelijk de juiste keuze maken. Computervertaalsystemen hebben echter meer moeite met het maken van zulke keuzes. 

 

Kunstmatige neurale netwerken

"De nieuwe aan de UvA ontwikkelde methode maakt gebruik van kunstmatige neurale netwerken, modellen waarbij het menselijk brein wordt nagebootst in een computer. Waar voorgaande vertaalsystemen veelal de meest voorkomende woordvormen kiezen, kiest de nieuwe methode de juiste woordvorm door de zinsopbouw in de brontaal te analyseren. Het neurale netwerk is in staat zelf grammaticale functies van woorden af te leiden, zonder dat het expliciete kennis van grammatica heeft",  vertelt Ke Tran, een van de onderzoekers.

 

De methode is daarmee niet afhankelijk van handgeschreven regels om functies van woorden te leren, een beperking die veel voorgaande methoden kennen. Het verkrijgen van zulke handgeschreven voorbeelden kan namelijk lastig en kostbaar zijn, met name voor kleinschalige talen. 

In de toekomst wordt de methode geïntegreerd in een vertaalsysteem - Oister genaamd - dat de groep van Christof Monz ontwikkelt aan de UvA.

Het onderzoek wordt uitgevoerd onder leiding van Christof Monz binnen het NWO Vidi-project `Surface Realization in Statistical Machine Translation'.

  

Ke Tran, Arianna Bisazza en Christof Monz: ‘Word Translation Prediction for Morphologically Rich Languages with Bilingual Neural Networks.' Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing.

 

Gerelateerd nieuws

heel holland hackt

Informaticastudenten winnen Heel Holland Hackt

Met een app om data te filteren hebben de Nijmeegse informaticastudenten Martijn Nanne, Nicky van Rijsbergen, Arjen Zijlstra en Sietse Mooren de programmeerwedstrijd Heel Holland Hackt gewonnen.

biofuel

‘De waarheid over biomassa'

Het verbranden van hout in elektriciteitscentrales draagt niet of nauwelijks bij aan besparing van CO2-uitstoot. Hetzelfde geldt voor de toepassing van bio-ethanol en biodiesel in auto's. Dit schrijft prof.dr. Rudy…

David Cope

De computer als componist: het hightech antwoord op Mozart? (video)

Iedereen heeft wel eens muziek gehoord die is gecomponeerd door een computer, meestal zonder dat te beseffen. Onderzoekers op het gebied van kunstmatige intelligentie hebben de afgelopen decennia grote vorderingen…

Gratis nieuwsbrief

EOL

 

Focus op

B&R Industriële Automatisering BV
B&R Industriële Automatisering BV

Perfection in Automation

DARE!!
DARE!!

Voor CE-markering, EMC en productveiligheid

Delmation Products BV
Delmation Products BV

Datacommunicatie-/ besturingstechniek

Indi.nl
Indi.nl

Totaalleverancier industriële onderdelen

Rotero Holland BV
Rotero Holland BV

Stappenmotor - Servomotor - Elektro Magneet

Testo Nederland BV
Testo Nederland BV

Meetoplossingen voor Professionals

TSB-Bescom BV
TSB-Bescom BV

Positie meten & motion control

Product van de maand

RSS
Nieuw! Lichtschermen PSENopt Advanced

De multifunctionele lichtschermen PSENopt Advanced worden voor uitgebreide functies ingezet zoals mutin en/of blanking.....

meanwell-web.com

Download gratis engineering boeken

A gratis boeken downloaden

 

Agenda

12 mei 2015, Eindhoven, Evoluon

Safety Event 2015

19 mei 2015, Nader te bepalen

Richtlijn Arbeidsmiddelen (D&F)

De training Richtlijn Arbeidsmiddelen is bestemd voor diegenen die verantwoordelijk zijn voor de...

19 mei 2015, Neurenberg

PCIM Europe

Meer agendapunten »