Tłumacz Google

Ocena: 4/10

Od dobrych dwudziestu lat słyszę szumne zapowiedzi, że jeszcze chwila i dzięki komputerom padną bariery językowe. Wystarczy tylko wrzucić do pamięci operacyjnej tekst w jednym języku, a komputer w mig poda jego wersję w innym. Wreszcie będzie można czytać wszystko, co nas interesuje, bez względu na to, w jakim kraju i po jakiemu zostało to opublikowane. Korzyści z takiej sytuacji byłyby ogromne – dla gospodarki, dla nauki, dla zwykłych ludzi – nic więc dziwnego, że w wielu ośrodkach trwają intensywne prace nad automatycznymi systemami tłumaczącymi.

Początkowo pomysł był taki, by opracować program, który potrafiłby analizować strukturę zdania, rozpoznawać w nim poszczególne części mowy i związki między nimi, a następnie – korzystając z wbudowanego słownika i zestawu reguł gramatycznych – inteligentnie podmieniać każdy element i rekonstruować z nich to zdanie w języku docelowym. Jest to metoda skuteczna w przypadku prostych i jednoznacznych komunikatów – w literaturze przedmiotu można znaleźć np. opis działającego tak programu komputerowego, który dla kanadyjskiej telewizji tłumaczy prognozy pogody z angielskiego na francuski i odwrotnie. Jeśli jednak tekst składa się z bardziej rozbudowanych wypowiedzi, o złożonej strukturze gramatycznej i nieoczywistych związkach międzywyrazowych, a zwłaszcza gdy język źródłowy i docelowy należą do różnych rodzin czy grup językowych, rezultaty okazują się dość mizerne. Przykładem może być recenzowany tu kiedyś program Translatica oraz wspominany przy tej okazji English Translator.

Ekspansja wyszukiwarki Google sprawiła, że pojawił się nowy pomysł – by wykorzystać zindeksowane miliony stron internetowych w najróżniejszych językach. W tym wypadku tłumaczenie odbywa się na zasadzie statystycznego przyporządkowywania słowom bądź frazom w jednym języku tego, co najczęściej pojawia się w analogicznych zdaniach w innym języku. Wydaje się to bardziej obiecującym rozwiązaniem, ponieważ przy tak gigantycznym materiale źródłowym znalezienie właściwego ekwiwalentu powinno być znacznie łatwiejsze niż w typowym słowniku, który uwzględnia tylko ułamek możliwych kontekstów i kombinacji słów. Co więcej, prócz przekładu skompilowanego automatycznie Tłumacz Google dla wielu słów podaje także po kilka propozycji alternatywnych, które można łatwo podmienić (wystarczy kliknąć podświetlany element w tekście docelowym i wskazać inną pozycję na liście). Jeżeli więc zaproponowane tłumaczenie nas nie zadowala, możemy je szybko skorygować. Możemy nawet wpisać własne, które zostanie skrzętnie zanotowane w pamięci Google’a, aczkolwiek – powiedzmy to sobie szczerze – z punktu widzenia zawodowych tłumaczy jest to klasyczne podcinanie gałęzi, na której się siedzi.

Jak to automatyczne tłumaczenie wygląda w praktyce, na przykładzie pary język angielski – język polski? Zacznijmy od plusów. Niewątpliwą zaletą Tłumacza Google jest umiejętność inteligentnego dodawania i usuwania pewnych słów, które w jednym języku są konieczne, by zdanie było poprawne gramatycznie i zrozumiałe, w drugim zaś zbędne. Ilustrują to takie oto dwa przykładowe fragmenty dłuższych zdań:

one of the most important benefits of her career

jedna z najważniejszych korzyści płynących z jej kariery

She has won two Grammys.

Zdobyła dwie nagrody Grammy.

za pomocą spektrofotometru firmy Perkin Elmer typ Lambda 35

using a spectrophotometer Perkin Elmer Lambda 35 type

W pierwszym przypadku w tłumaczeniu pojawiło się słowo płynących, którego w oryginale nie ma, ale program uznał, że być powinno, bo tego wymaga język polski (fraza korzyści płynące z pojawia się w bardzo wielu zindeksowanych tekstach). Jako rozwiązania alternatywne dla tego elementu zaproponował jednocześnie frazy korzyści wynikających z, korzyści z, korzyści i zalet. W drugim przypadku rozpoznał sens użytej nazwy własnej i jej formę gramatyczną (liczba mnoga), w rezultacie czego także dodał od siebie rzeczownik nagrody. W trzecim przykładzie dla odmiany wyrzucił słowo firmy, użyte w polskim oryginale wyłącznie dla wprowadzenia obcojęzycznej nazwy własnej. Tradycyjny translator komputerowy, który tłumaczy każde słowo, na pewno umieściłby tu w angielskiej wersji jakiś – całkowicie niepotrzebny – ekwiwalent leksykalny (company, firm, business…).

Nazwy własne to w ogóle obszar, w którym Tłumacz Google bije na głowę translatory komputerowe. Potrafi na przykład zidentyfikować płeć:

American singer Roy Acuff

amerykański piosenkarz Roy Acuff

American singer Savannah Outen

amerykańska piosenkarka Savannah Outen

a niekiedy i poprawnie utworzyć formę mianownikową od przypadków zależnych (w trzecim przykładzie zwraca uwagę dodany przyimek by dla oddania dopełniacza):

amerykańskiego piosenkarza Roya Acuffa
American singer Roy Acuff

spotkał się z Krystyną Jandą
met with Krystyna Janda

To jedna z najważniejszych książek Czesława Miłosza.
This is one of the most important books by Czeslaw Milosz.

Na pierwszy rzut oka imponująco wygląda również tłumaczenie w odwrotną stronę, gdy trzeba utworzyć polski przypadek zależny od angielskiego imienia i nazwiska. Tłumacz Google potrafi się wówczas prawidłowo posłużyć apostrofem (co w internecie jest skądinąd rzadką umiejętnością):

This film is based on a novel by Oscar Wilde.
Ten film jest oparty na powieści Oscara Wilde’a.

Arianna Huffington blames the national debt crisis and high unemployment solely on George Bush.
Arianna Huffington obwinia narodowego kryzysu zadłużenia i wysokiego bezrobocia wyłącznie na George’a Busha.

Z moich obserwacji wynika jednak, że dotyczy to tylko dopełniacza (a i to nie zawsze), albowiem w pozostałych przypadkach rezultaty nie odbiegają od osiągnięć zwykłych translatorów:

No other car is more strongly identified with Steve McQueen.
Żaden inny samochód nie jest silniej utożsamia się z Steve McQueen.

The last time I saw John Wayne was a few weeks before his death.
Ostatni raz widziałem John Wayne był kilka tygodni przed jego śmiercią.

Rozpoznawanie płci i odmiana przez przypadki działa bardzo wybiórczo, bo z nieco mniej znanymi polskimi nazwiskami mechanizm ten radzi sobie kiepsko:

Polish singer Maria Koterbska
Maria Koterbska polski piosenkarz

polskiej piosenkarki Marii Koterbskiej
Polish singer Maria Koterbskiej

Co gorsza, jeśli imię i nazwisko nie należą do osoby publicznej, mogą z nich powstawać przedziwne twory:

spotkał się z Krystyną Morawską
met with Christine Moravian

Podpis pod dokumentem złożyła Elżbieta Konieczna.
Signature of the document by Elizabeth necessary.

Zdarza się to zresztą i z postaciami historycznymi, jak choćby z Paskiem – mimo że dorobił się hasła i w internetowej Britannice, i w anglojęzycznej Wikipedii, a w Amazon.com można nawet kupić tłumaczenie jego pamiętników:

artykuł na temat Jana Chryzostoma Paska
An article on John Chrysostom Pasek

książka o Janie Chryzostomie Pasku
a book about John Chrysostom Bar

(Swoją drogą zastanawia tu arbitralne użycie wielkiej/małej litery na początku frazy).

Również przy tłumaczeniu na angielski polskich nazw geograficznych i form pochodnych można uzyskać bardzo zadowalające rezultaty. W pierwszym przykładzie widzimy opisaną już wcześniej zmianę przypadka zależnego w mianownik, w dwóch pozostałych zaś – przekształcenie formy przymiotnikowej w odpowiednią nazwę rzeczownikową:

parafia Świętej Katarzyny w Będzinie-Grodźcu
parish of St. Catherine in Bedzin-Grodziec

Najczęściej odwiedzanym obiektem jest Sanktuarium Matki Boskiej Licheńskiej.
The most popular subject is the Sanctuary of Our Lady of Lichen.

Unikatowym miejscem jest Lednicki Park Krajobrazowy, chroniący zabytki związane z początkami państwa polskiego.
A unique place is Lednica Landscape Park, protecting monuments connected with the beginnings of the Polish state.

Ale i w tej kategorii niczego nie można być pewnym, bo na przykład z takiego zdania powstaje kompletny bełkot:

Kolej wąskotorowa obsługuje trasę z Gniezna do Anastazewa w przepięknym Powidzkim Parku Krajobrazowym.
Supports narrow-gauge railway route from Gniezno to Anastazewa Powidzkim in beautiful Park.

Znacznie lepiej niż w translatorach komputerowych wygląda tłumaczenie wielu nazw instytucji czy organizacji (również akronimów), ponieważ otrzymujemy ich rzeczywiste brzmienie w języku docelowym, a nie dosłowne znaczenie:

Źródłem bezzwrotnej pomocy finansowej w postaci dwóch instrumentów pod nazwą Mechanizm Finansowy EOG oraz Norweski Mechanizm Finansowy są trzy kraje EFTA (Europejskiego Stowarzyszenia Wolnego Handlu).

The source of non-repayable financial assistance in the form of two instruments under the name of the EEA Financial Mechanism and Norwegian Financial Mechanism are the three countries of EFTA (European Free Trade Association).

Nazwa w nawiasie została przetłumaczona prawidłowo, co więcej, Tłumacz Google zidentyfikował też i odpowiednio podmienił akronim EOG (Europejski Obszar Gospodarczy, czyli European Economic Area). Dla porównania: Translatica zrobiła z tego (of European association of the free trade) oraz the financial EOG mechanism.

Dzięki tym samym mechanizmom porównywania różnojęzycznych tekstów w internecie możliwe jest także podawanie w poprawnym brzmieniu tytułów filmów i książek:

the film The Devil Wears Prada, starring Meryl Streep
Film Diabeł ubiera się u Prady, z udziałem Meryl Streep

Kilka lat po wojnie ukazała się jego powieść „Popiół i diament”.
A few years after the war he published his novel „Ashes and Diamonds”.

I tutaj jednak żadnych gwarancji nie ma, nawet w odniesieniu do bardzo znanych pozycji kina amerykańskiego:

w filmie „Charlie włóczęga” Chaplina
in the film ‚hobo Charlie „Chaplin

– oryginalny tytuł tej klasyki kina niemego to The Vagabond. W tym wypadku dopełniacz od nazwiska został też rozpoznany tylko częściowo, zniknął bowiem w tłumaczeniu (por. cytowane wyżej książek Czesława Miłosza). Uwagę zwracają także śmieci powstałe z cudzysłowu.

1   2   3