Etikettarkiv: Google översätt

23. Europa runt med Google översätt

Dan före dopparedan, det är årets pysseldag. Jag har förberett julpysslet lite inför dagens julkalenderlucka. En sen decembernatt satt jag nämligen och umgicks med min gamla trotjänare Google översätt.

Pysslet gick till så att jag tog julkalendermeningen ”Den tjocka tomten åt upp Rudolfs risgrynsgröt”, och lät Google översätt översätta den från svenska till finska. ”paksu juomi söi Rudolph on riisipuuroa”, sa Google översätt. Detta översatte jag sedan till estniska, och så från estniska till  ryska, vidare till lettiska, litauiska och så vidare tills jag och Google översätt hade gått Europa runt. Totalt har meningen passerat 38 europeiska språk. Så här blev resultatet:

Dessvärre stötte vi på patrull redan vid andra översättningen. Estniskan fattade inte riktigt formen riisipuuroa, och därför hängde den med i sin ursprungsform genom alla resterande 36 språk. Det är kanske det mest påtagliga i denna version, som närmast kommer från norskan.

Egentligen är jag positivt inställd till Google översätt. Den tjänsten klarar av betydligt mer än vad offentlig datorstödd översättning klarade av för bara fem år sedan. Bland annat brukar den vara bra på att snappa upp sammanhang, och därför välja rätt betydelse i mångtydiga ord. Detta maraton runt hela Europa verkar dock ha varit mer än vad den klarade av.

Det enda ord som går att känna igen från den första svenska versionen är Rodolfo. I övrigt har översättningen gjort många felaktiga betydelseval. Tidigt förvandlades tomten till tricks, och ungefär samtidigt blev tjock till omväxlande fet eller djärv. I övergången mellan polska och georgiska byttes detta ord ut till nyheter, vilket sedan hängde kvar till slutversionen. Ordet för träd finns med i de flesta översättningar, och det tycks ha dykt upp från ursprungsmeningens risgrynsgröt via julgran. Trädet hängde faktiskt kvar ända till norskan, men i översättningen mellan norska och svenska gissade Google översätt felaktigt att det handlade om siffran i stället för växten.

Många felaktiga betydelseval från Google översätt alltså; egentligen inte något korrekt val, om man inte räknar namn. Däremot får man ge tjänsten cred för att den lyckades hålla meningen någorlunda syntaktiskt intakt. Det får räknas som förlåtligt att den trasslade till det med riisipuuroa och Rodolfo, eftersom den antagligen inte kände igen något av dessa ord. Tjänsten klarade dock av numerusböjningen: tre leder till viktiga och nyheter. Dessutom klarar den av en stilsäker förstärkning av adjektivet i mycket viktiga.

Som översättningstjänst för långväga översättningar måste jag tyvärr ge Google översätt underkänt i detta jultest. Jag hoppas dock att tjänsten fortsätter att utvecklas och förbättras. Världen blir ju bara större och större ju mer avståndet mellan folken minskar. Det är en stor tillgång att åtminstone kunna få ett hum av vad det står i en litauisk text. Just nu är Google översätt trots allt det bästa verktyg jag har för det.

Det var det sista vi såg av tomten och Rudolfs risgrynsgröt för i år. I morgon är det julafton, och då bjuder julkalendern på en språkjulklapp.

9 kommentarer

Under Julkalender 2010

Framtiden är nära

Jisses. Jag väntar mig en Jetpack inom de närmaste månadernas framtid. I går testade jag nämligen Google Översätt. Det var sent på eftermiddagen och jag slöläste en artikel om språkförståelse, som nämnde att datorer inte förstår språk. Lite illmarigt bestämde jag mig för att retas med Google Översätt. Jag tänkte att översättningen kunde få statuera som ett vackert exempel här i bloggen. ”Researchers in the field of artificial intelligence (AI) have occupied themselves with this question in their quest to build intelligent computer systems that can perform human tasks such as problem solving and language comprehension.”, skrev jag till robotöversättaren, beväpnad med ett hånflin, pösigt nöjd över min mänskliga oöverträffbara språkförmåga.

Hånflinet fick dock en kort livstid. Se här på Googles översättning till svenska: ”Forskare inom artificiell intelligens (AI) har sysselsatt sig med denna fråga i deras strävan att bygga intelligenta datorsystem som kan utföra mänskliga uppgifter såsom problemlösning och språkförståelse.”

Hatten av! Översättningen har bara ett enda fel, och det är dessutom ett fel som infödda svensktalare gör ofta. Det är att ”deras” ska bytas ut till ”sin”, eftersom det syftar på subjektet. De engelska särskrivningarna som på svenska ska vara hopskrivna klarar översättningen av. Den förstår också att vi svenskar inte använder konstruktioner som ”forskare inom fältet av”, och stryker således den biten. Dessutom vet den att ”occupied” inte ska översättas bokstavligt till ”ockuperat”, utan lämpligen till ”sysselsatt” (om man i stället skriver in ”In 1936, Germany occupied Poland” översätter den – till råga på allt enligt grammatikens alla v2-regler – till ”År 1936 ockuperade Tyskland Polen”).

Snart är framtiden här. Jag betraktar utvecklingen med andakt.

4 kommentarer

Under Språk