Spis treści Artykuł originalny « Poprzedni artykul Nastepny artykul »

Tłumaczenie maszynowe własnych nazw

Maŝina tradukado de propraj nomoj

Orignał w języku EsperantoMaszynowe tłumaczenie na język polski

Propraj nomoj farigas multajn problemojn ĉe maŝina tradukado kaj gramatika korektado. Malfacila estas la identigo de propraj nomoj kaj ilia sintaksa analizo. Ankaŭ tradukado de propraj nomoj ne estas facila kaj oni frontas multajn problemojn. En la plej simpla kazo propraj nomoj tute ne estas tradukitaj, en alia kazo depende de cela lingvo propraj nomoj devas havi fleksiajn finilojn. Kiel kutime la bonan enkondukon donas PMEG.

Similajn problemojn oni frontas ankaŭ ĉe mallongiĝoj, akronimoj, matematikaj simboloj kaj citaĵoj.

Korekta pritakso de propraj nomoj estas tre grava ĉe maŝina traduko. Ĉar en multaj ĵurnalaj tekstoj preskaŭ ne ekzistas frazoj sen propraj nomoj, la okulfrapa kvalito de tradukado dependas multe de tradukado de propraj nomoj.

Specoj de Propraj Nomoj

Propraj nomoj ĝenerale funkcias en frazo same kiel substantivoj. Ĝenerale oni povas diferenci proprajn nomojn laŭ:

  • Esperantigitaj aŭ ne esperantigitaj propraj nomoj
  • unuvortaj aŭ multvortaj propraj nomoj
  • puraj substantivaj aŭ adjektivigitaj propraj nomoj (ekz: Varsovia vento
  • tipoj de nomigitaj objektoj: geografiaj nomoj, firmaoj, homoj, asocioj, titoloj
  • Propraj nomoj, kiuj estas normalaj esperantoj frazpartoj (ekz: Libera Folio, Ondo de Esperanto)

Esperantigitaj propraj nomoj faras la plej malgrandajn problemojn, ĉar ili povas esti pritraktataj kiel normalaj esperantaj vortoj. En Esperantilo oni povas difini en esperanta vortaro por radikoj kaj substantivo, ke ili estas propraj nomoj. La gramatika korektilo sugestas skribi ĉiujn proprajn nomoj per grandaj literoj.

Propraj Nomoj en Sintaksa Analizo

Propraj nomoj funkcias en frazo same kiel substantivoj, sed ili ne povas havi la difinilon ‘la’. Ne esperantigitaj propraj nomoj kutime ne havas la akuzativan finilon. Kelkaj esperantigitaj propraj nomoj aperas nur en plurala formo (ekz: filipinoj)

  • Paweł Lemian skibis tiun leteron.
  • Mi renkontis Krystyna lastan semajnon.
  • La reĝo ankaŭ fundis urbon Mins Mazowiecki.
  • Reihn estas la plej granda rivero en Germanio.
  • TEJO-uloj partoprenis IS parolis pri EO kaj dancis laŭ DĴ ĉe E-muziko.
  • Maŝina Tradukado (MT) ne sukcesis plene. Oni ne devas multe atendi de MT.

En sintaksa analizo oni rimarku du konstruaĵojn. Unue la identiga priskribo de ceteraj substantivoj:

  • Sinjoro Marek Boder
  • Urbo Rybnik
  • Firmao MicoBrain

Due la familinomoj aperas ofte kun antaŭnomoj en duopoj. Sintaksa analizilo en Esperantilo grupigas tiuj nomojn en branĉo “nomo”.

sintaksa analizo de propraj nomoj

Identigo de Propraj Nomoj

Oni povas uzi kelkajn trajtojn de propraj nomoj por identigo

  • Propraj nomoj estas skribitaj per granda litero.
  • Propraj nomoj staras ofte post ceteraj substantivoj (sinjoro, rivero, libro, urbo…).
  • Ne esperantigitaj propraj nomoj ofte enhavas ne esperantajn literojn (”xyąóćęłńśźż”).
  • Proprajn nomojn oni ofte skribas en apostrofoj.
  • Proprajn nomojn oni ofte skribas per kursivaj literoj.
  • Mallongiĝoj kaj Akronimoj uzas nur grandajn literojn (UEA, TEJO, UFO).
  • Propraj nomoj aperas multfoje en unu teksto.

Esperantilo uzas ankaŭ la internan liston de ignoritaj vortoj por identigi proprajn nomojn. Pripensebla estas ankaŭ vortaro de propraj nomoj. La kompleta listo de ĉiuj geografiaj nomoj aŭ ĉiuj homoj ne estas realigebla, sed oni povas celi kolekti proprajn nomojn, kiuj estas ofte uzataj en ia tekstaro.

Teknike tre komplika estas identigo de propraj nomoj, kiuj estas ŝajne normalaj esperantaj frazpartoj. Tio estas ofte nomoj de ĵurnaloj kaj asociacioj. Ankaŭ ofte neesperantigitaj propraj nomoj, familinomoj aŭ antaŭnomoj estas hazarde kutimaj esperantaj vortoj. Ni pripensu konatajn Esperantistojn: Claude Piron, Barbara Pietrzak.

Fine oni povas la taskon de identigo de propraj nomoj lasi al uzanto kaj oferi al li komfortan surfacon.

Aŭtomata kolektado kaj testado de propraj nomoj

Identigo de propraj nomoj povas esti praktika funkcio ĉe analizo de tekstaro. Por identigo de familinomoj estus tre praktika la listo de oftaj antaŭnomoj aŭ familinomoj. Ĉe konataj homoj aŭ geografiaj nomoj oni povus aŭtomate konsulti aliajn gradajn leksikonojn ekzemple: Vikipedio.

Tradukado de Propraj Nomoj

La tradukado de propraj nomoj estas aparte komplika afero. Unue oni devas kondiĉi, ke sintaksa analizo bone rekonis tiujn. La tradukado dependas de cela lingvo kaj la speco de propra nomo. Ni havas sekvajn eblojn.

  • Esperantigitaj propraj nomoj estas tradukitaj laŭ traduka vortaro.
  • Ne esperantigitaj propraj nomoj ne estas tradukitaj.
  • Ne esperantigitaj propraj nomoj estas tradukitaj laŭ reguloj de fonta lingvo.

En slavaj lingvoj, kie verboj estas fleksigitaj laŭ genro, estas tre grava la genro de la persono. Ekzemple oni tradukas.

  • Barbar Pietrzak legis . Barbar Pietrzak czytała.
  • Claude Piron legis. Barbar Pietrzak czytał.

Ankaŭ en pola lingvo familinomoj havas finilojn.

  • Mi ofte aŭskultis Barbar Pietrzak en pola radio. Często słuchałem Barbarę Pietrzak w polskim radiu.

Ĉar ne esperantigitaj geografiaj nomoj uzas la nomon de fonta lingvo, estas granda problemo, kiam la cela lingvo havas enproprigitan formon de tiu nomo.

  • Mi estis en Köln. (pola traduko) Jestem w Kolonii.

Plej komplika estas la tradukado de akronimoj kaj propraj nomoj, kiuj estas normalaj esperantaj subfrazoj. Ofte akronimoj ekzistas por iu specifa lingvo aŭ kulturo. Tipaj akronimoj de Esperanto UEA kaj TEJO oni ne povas traduki rekte al nacia lingvo, ĉar en tiu lingvo, tiuj nomoj ne estas konataj. La solvo povas esti ŝanĝo de akrionimoj al plena nomo aŭ aldona priskribo.

  • Kongreso de UEA okazis en Pekino. (pola traduko) Kongres UEA (Światowego Związku Esperantystów) miał miejsce w Pekinie.

Komplika estas ankaŭ pritrakto de nomoj de ĵurnaloj aŭ asocioj, kiuj ofte estas regulaj frazpartoj. Pricipe tiujn nomojn oni ne tradukas, sed ofte aldonas pluajn informojn.

  • Libera Folio okulfrapas per mistrafaj titoloj de siaj artikoloj. (pola traduko) "Libera Folio" (esperancka gazeta internetowa) zaskakuje nieudanymi tutułami swoich artykułów.

Tradukado de propraj nomoj en Esperantilo

Esperantilo ĝis nuna eldono prilaboras nur kelkajn tipojn de propraj nomoj. Esperantigitaj propraj nomoj ne faras problemojn kaj povas esti difinitaj en traduka vortaro. Sintaksa analizilo rekonas grupojn de antaŭnomo kaj familinomo, se ĝi trafas du nekonatajn vortojn, kiuj estas skribitaj per granda litero. Identiga suplemento de substantivo estas rekonata. Mankas nun la eblo difini kompleksaj propraj nomoj kaj tradukado de akronimoj. Ankaŭ bezonata por pola tradukado genro de antaŭnomoj ne estas uzata, do ĉiuj nomoj estas aŭ viraj aŭ inaj. Fleksio de familinomoj estas en pola lingvo tre kompleksa kaj ĝis nun tute ne konsiderata. Mi volas iam kolekti ĉiujn substantivoj, kiuj povas estas priskribitaj per propraj nomoj (ekz: Sinjoro, Urbo, Rivero, Firmao). Mi supozas, ke por plibonigo de tradukado, estus necesa antaŭa analizo de teksto je propraj nomoj.

Alia temo estas la difino de tradukaj informoj de uzanto por cetera teksto. Tio estas propraj vortaroj kaj listoj kun propraj nomoj.

Własne nazwy skłonią liczne problemy przy tłumaczeniu maszynowym i gramatycznej korekturze. Trudna jest identyfikacja własnych nazw i ich syntaktycznej analizy. Także tłumaczenie własnych nazw nie jest łatwe i spotyka się z licznymi problemami. W najprostszym przypadku własne nazwy całkiem nie są przetłumaczone, w innym przypadku zależnie docelowego języka własne nazwy muszą mieć fleksyjne końcówki. Jak zazwyczaj dobre zagajenie daje PMEG.

Z podobne problemami spotyka się także przy {mallongiĝoj}, akronimy, nazwy matematyczne i cytaty.

Ocena korektowa własnych nazw jest bardzo ważna przy tłumaczeniu maszynowym. Ponieważ w licznych tekstach dziennikarskich nieomal nie istnieją zdania bez własnych nazw, rzucająca się w oczy jakość tłumaczenia zależy wiele od tłumaczenia własnych nazw.

Rodzaje Własnego Nomoju

Własne nazwy ogólnie funkcjonują we zdaniu zarówno jak rzeczowniki. Ogólnie można rozróżnić własne nazwy według:

  • {Esperantigitaj} albo nie {esperantigitaj} własne nazwy
  • jednowyrazowe albo wielowyrazowe własne nazwy
  • czyści rzeczownikowe albo {adjektivigitaj} własne nazwy ({ekz}: Varsovia vento
  • typy {nomigitaj} rzeczy: geograficzne nazwy, firmy, ludzie, stowarzyszenia, nagłówki
  • Własne nazwy, którymi są normalne esperanto części zdania ({ekz}: Libera Folio, Ondo de Esperanto)

{Esperantigitaj} własne nazwy robią najmniejsze problemy, ponieważ oni mógą być zajmowani się jako normalne esperanckie słowa. W Esperantilo można definiować w esperanckim słowniku dla pierwiastków i rzeczowniku, że oni są własnymi nazwami. Gramatyczny {korektilo} podsuwa pisać wszystkich własny nazwy dużymi literami.

Własny Nomoj w Syntaktycznej Analizie

Własne nazwy funkcjonują we zdaniu zarówno jak rzeczowniki, lecz oni nie mógą mieć {difinilon} ‘’. Nie {esperantigitaj} własne nazwy zazwyczaj nie mają końcówki biernikowej. Kilka {esperantigitaj} własnych nazw pojawia się jedynie w {plurala} kondycji ({ekz}: filipinoj)

  • Paweł Lemian skibis tiun leteron.
  • Mi renkontis Krystyna lastan semajnon.
  • La reĝo ankaŭ fundis urbon Mins Mazowiecki.
  • Reihn estas la plej granda rivero en Germanio.
  • TEJO-uloj partoprenis IS parolis pri EO kaj dancis laŭ DĴ ĉe E-muziko.
  • Maŝina Tradukado (MT) ne sukcesis plene. Oni ne devas multe atendi de MT.

W syntaktycznej analizie powinno się zauważyć dwa budynki. Po pierwsze identyfikujący opis pozostałych rzeczowników:

  • Sinjoro Marek Boder
  • Urbo Rybnik
  • Firmao MicoBrain

Po drugie nazwiska pojawiają się często z imionami w duetach. Syntaktyczny analizator w Esperantilo grupuje ci nazwy w branży “nazwa”.

sintaksa analizo de propraj nomoj

Identyfikacja Własnego Nomoju

Można użytkować kilka cech własnych nazw dla identyfikacji

  • Własne nazwy są napisane dużą literą.
  • Własne nazwy stoją często po pozostałych rzeczownikach (pan, rzeka, książka, miasto…).
  • Nie {esperantigitaj} własne nazwy często mieszczą nie esperanckie litery (”{xyąóćęłńśźż}”).
  • Własne nazwy często pisze się w apostrofach.
  • Własne nazwy często pisze się {kursivaj} literami.
  • {Mallongiĝoj} i Akronimy użytkują jedynie duże litery (UEA, TEJO, UFO).
  • Własne nazwy pojawiają się częstokroć w jednym tekście.

Esperantilo użytkuje także wewnętrzny spis wcześniej ignorowanych słów aby utożsamiać własne nazwy. Możliwy do zastanowienia jest także słownik własnych nazw. Kompletny spis wszystkich geograficznych nazw albo wszystkich ludzi nie jest wykonalny, lecz można dążyć zbierać własne nazwy, które są często użytkowane w jakiejś grupie tekstów.

Technicznie bardzo skomplikowana jest identyfikacja własnych nazw, którymi są na pozór normalne esperanckie części zdania. To są często nazwy dzienników i asocjacji. Także często {neesperantigitaj} własne nazwy, nazwiska albo imiona są losowo zwyczajnymi esperanckimi słowami. Powiniśmy przemyśleć znanych Esperantystów: Claude Piron, Barbara Pietrzak.

W końcu można zadanie identyfikacji własnych nazw pozwolić do użytkownika i ofiarować do niego wygodną powierzchnię.

Automatyczny zbiór i testowanie własnych nazw

Identyfikacja własnych nazw może być praktyczną funkcją przy analizie grupy tekstów. Dla identyfikacji nazwisk byłby bardzo praktyczny spis częstych imion albo nazwisk. Przy znanych ludziach albo geograficznych nazwach można by było automatycznie radzić się inne n-tege stopnia leksykony na przykład: Wikipedia.

Tłumaczenie Własnego Nomoju

Tłumaczenie własnych nazw jest szczególnie skomplikowaną sprawą. Po pierwsze trzeba uzależniać, że syntaktyczna analiza dobrze tych rozpoznała. Tłumaczenie zależy od docelowego języka i rodzaju własnej nazwy. Mamy kolejne możliwości.

  • {Esperantigitaj} własne nazwy są przetłumaczone według słownik tłumaczeniowy.
  • Nie {esperantigitaj} własne nazwy nie są przetłumaczone.
  • Nie {esperantigitaj} własne nazwy są przetłumaczone według prawidła przez źródłowy język.

We słowiańskich językach, gdzie czasowniki są {fleksigitaj} według rodzaj, jest bardzo ważny rodzaj osoby. Na przykład tłumaczy się.

  • Barbar Pietrzak odtwarzał. Barbar Pietrzak {czytała}.
  • {Claude} Gruszkę odtwarzało. Barbar Pietrzak {czytał}.

Także w języku polskim nazwiska mają końcówki.

  • Często słuchałem Barbara Pietrzaka w radiu polskim. Często {słuchałem} Barbar{ę} Pietrzak {w} {polskim} powina promienieć.

Ponieważ nie {esperantigitaj} geograficzne nazwy użytkują nazwę źródłowego języka, jest duży problem, kiedy docelowy język ma {enproprigitan} kondycję tej nazwy.

  • Mi estis en Köln. (pola traduko) Jestem w Kolonii.

Najbardziej skomplikowane jest tłumaczenie akronimów i własne nazwy, którymi są normalne esperanckie zdania podrzędne. Często akronimy istnieją dla jakiegoś swoistego języka albo kultury. Typowe akronimy Esperanto UEA i TEJO nie mógą tłumaczyć wprost do narodowego języka, ponieważ w tym języku, te nazwy nie są znane. Rozwiązanie może być zmianą {akrionimoj} do pełnej nazwy albo dodatkowego opisu.

  • Kongres UEA zdarzył się w Pekino. (tłumaczenie polskie) Kongres UEA (Światowego Związku Esperantystów) {miał} {miejsce} {w} {Pekinie}.

Skomplikowane jest także zajmowanie nazw dzienników albo stowarzyszenia, którymi często są prawidłowe części zdania. {Pricipe} tych nazw nie tłumaczy się, lecz często dokłada się dodatkowe informacje.

  • Libera Folio okulfrapas per mistrafaj titoloj de siaj artikoloj. (pola traduko) "Libera Folio" (esperancka gazeta internetowa) zaskakuje nieudanymi tutułami swoich artykułów.

Tłumaczenie własnych nazw w Esperantilo

Esperantilo do obecnej lini bazowej przetwarza jedynie kilka typów własnych nazw. {Esperantigitaj} własne nazwy nie robią problemów i mógą zostać konieczne w słowniku tłumaczeniowym. Syntaktyczny analizator rozpozna grupy imienia i nazwiska, jeśli ono zastaje dwa nieznane słowa, które są napisane dużą literą. Identyfikujące uzupełnienie rzeczowniku jest rozpoznane. Brakuje teraz możliwość definiować skąplikowane własne nazwy i tłumaczenie akronimów. Także potrzebny dla polskiego tłumaczenia rodzaj imion nie jest użytkowany, więc wszystkie nazwy są albo męskie albo żeńskie. Fleksja nazwisk jest w języku polskim bardzo skąplikowanym i do teraz całkiem nie uważany. Chcę kiedyś zbierać wszystkich rzeczowniki, które mógą są opisane własnymi nazwami ({ekz}: Pan, Miasto, Rzeka, Firma). Przypuszczam, że dla ulepszenia tłumaczenia, byłaby konieczna uprzednia analiza tekstu o własnych nazwach.

Inny temat jest definicją tłumaczeniowych informacji użytkownika dla pozostałego tekstu. To są własne słowniki i spisy ze własnymi nazwami.

Artukuł został przetłumaczony w pełni maszynowo przez wolny program Esperantilo
Adres kontaktowy:
mail@xdobry.de