Revizija mašinskog prevoda

Revizija mašinskog prevoda (ili redaktura mašinskog prevoda) je postupak pri kome ljudi ispravljaju mašinski prevod kako bi postigli prihvatljiv konačni proizvod. Osoba koja vrši uređivanje naziva se redaktor mašinskog prevoda. Koncept revizije mašinskog prevoda je u vezi sa konceptom pripreme izvornog teksta za mašinsko prevođenje. U procesu prevođenja teksta pomoću mašinskog prevođenja, najbolji rezultati mogu se postići pripremom izvornog teksta unapred – na primer primenom principa kontrolisanog jezika – a zatim naknadnim uređivanjem izlaznog rezultata mašine. Razlikuje se od redakture, koja se odnosi na proces poboljšanja teksta proizvedenog od strane ljudi (postupak koji je često poznat kao revizija u prevodilačkoj industriji). Revidirani tekst se može naknadno pregledati kako bi se osigurao kvalitet jezičkih izbora ili lekturisati radi ispravljanja jednostavnih grešaka.

Revizija mašinskog prevoda uključuje ispravku izlaznog rezultata mašinskog prevođenja kako bi se osiguralo da ono zadovoljava nivo kvaliteta koji je unapred dogovoren između klijenta i redaktora. Delimična redaktura mašinskog prevoda ima za cilj da rezultat bude jednostavno razumljiv; potpuna redaktura mašinskog prevoda i da ga takođe učini stilski prikladnim. Sa napretkom u mašinskom prevođenju, potpuna redaktura mašinskog prevoda postaje alternativa ručnom prevođenju. Praktično svi alati za računarski potpomognuto prevođenje (SAT) sada podržavaju redakturu izlaznih rezultata do kojih se došlo uz pomoć mašinskog prevoda.

Revizija mašinskog prevoda i mašinsko prevođenje

uredi

Mašinsko prevođenje je izašlo iz okvira laboratorija i počelo da se koristi u svoje prave svrhe krajem sedamdesetih godina u nekim velikim institucijama kao što su Evropska komisija i Panamerička zdravstvena organizacija, a zatim, kasnije, i u nekim korporacijama kao što su Katerpilar i Dženeral motors. Prva istraživanja o redakturi mašinskog prevoda u vezi sa ovim implementacijama pojavile su se osamdesetih godina. [1] Da bi razvili odgovarajuće smernice i obuku, članovi Asocijacije za mašinski prevod u Americi (AMTA) i Evropske asocijacije za mašinske prevode (EAMT) osnovali su 1999. godine Specijalnu interesnu grupu za redakturu mašinskog prevoda. [2]

Posle devedesetih, napredak u računarskoj snazi i povezivanju ubrzao je razvoj mašinskog prevođenja i omogućio njegovu primenu putem veb pregledača, uključujući ga kao besplatan i koristan dodatak glavnim pretraživačima (Gugl prevodilac, Bing Translator, Yahoo! Babel Fish). Šire prihvatanje manje savršenog mašinskog prevoda praćeno je i širim prihvatanjem redakture mašinskog prevoda. Kako potražnja za lokalizacijom dobara i usluga raste brzinom koju ljudski prevodi ne mogu da zadovolje, čak ni uz pomoć prevodilačke memorije i drugih tehnologija za upravljanje prevodima, institucije iz ove industrije kao što je Društvo korisnika automatizacije prevoda (TAUS) očekuju da će mašinsko prevođenje i redaktura mašinskog prevoda u narednih nekoliko godina imati mnogo veću ulogu. [3]

Korišćenje mašinskog prevoda ponekad zahteva pripremu teksta za mašinsko prevođenje.

Delimična i potpuna redaktura mašinskog prevoda

uredi

Studije osamdesetih godina su razlikovale nivoe redakture mašinskog prevoda koji su, u kontekstu prevodilačke službe Evropske komisije, najpre definisani kao konvencionalni i brzi [4] ili potpuni i brzi. [5] Čini se da su delimična i potpuna redaktura mašinskog prevoda formulacije koje se danas najviše koriste.

Delimična redaktura mašinskog prevoda podrazumeva minimalnu intervenciju redaktora mašinskog prevoda, kao strogo potrebne kako bi pomogla krajnjem korisniku da shvati tekst; očekuje se da će je klijent koristiti samo za primanje tekstova, često kada je tekst hitno potreban ili je vremenski raspon kratak.

Potpuna redaktura mašinskog prevoda uključuje veći nivo intervencije kako bi se postigao određeni nivo kvaliteta o kojem se pregovara između klijenta i redaktora mašinskog prevoda; očekuje se da će ishod biti tekst koji je ne samo razumljiv već i predstavljen na neki stilski odgovarajući način, pa se može koristiti za potpuno razumevanje teksta, pa čak i za distribuciju teksta, u svrhu slanja i primanja teksta.

Kao krajnji cilj potpune redakture mašinskog prevoda očekuje se nivo kvaliteta koji se ne razlikuje od nivoa ljudskog prevođenja. Pretpostavka je, međutim, bila da je potrebno manje napora da prevodioci rade direktno iz izvornog teksta nego da rediguju mašinski generisanu verziju. Sa napretkom u mašinskom prevođenju, ovo će se možda promeniti. Za neke jezičke parove i za neke zadatke, kao i sa motorima koji su usklađeni s podacima visokog kvaliteta specifičnim za dati domen, neki klijenti već zahtevaju od prevodilaca da izvrše redakturu mašinskog prevoda umesto da prevode od početka, u uverenju da će postići sličan kvalitet po nižoj ceni.

Podela na delimičnu i potpunu redakturu, razvijena devedesetih godina kada je mašinsko prevođenje još uvek bilo na CD-ROM-u, možda neće odgovarati napretku u mašinskom prevođenju čak ni po pitanju delimične redakture. Za neke jezičke parove i neke zadatke, posebno ako je izvor unapred uređen, sirovi mašinski izlaz može biti dovoljno dobar za shvatanje suštine, bez potrebe za naknadnom ljudskom intervencijom.

Efikasnost redakture mašinskog prevoda

uredi

Redaktura mašinskog prevoda se koristi kada sirovo mašinsko prevođenje nije dovoljno dobro, a ljudsko prevođenje nije potrebno. Industrija savetuje da se redaktura mašinskog prevoda koristi onda kada se može barem udvostručiti produktivnost ručnog prevođenja, čak i četvorostruko u slučaju delimične redakture.[traži se izvor] Međutim, efikasnost redakture mašinskog prevoda je teško predvideti. Razne studije kako iz akademske zajednice tako iz industrije tvrde da je redaktura mašinskog prevoda brža od prevođenja teksta od početka, bez obzira na jezičke parove ili iskustvo prevodilaca. [6] Međutim, ne postoji saglasnost oko toga koliko se vremena može uštedeti redakturom mašinskog prevoda u praksi (ako uopšte postoji): Iako industrija izveštava o uštedi vremena od oko 40%, [7] neke akademske studije sugerišu da ušteda vremena u stvarnim radnim uslovima verovatnije iznosi između 0–20%. Profesionalci su takođe prijavili negativan porast produktivnosti tamo gde ispravke zahtevaju više vremena nego onda kada se prevodi iz početka.

Redaktura mašinskog prevoda i jezička industrija

uredi

Posle nekih trideset godina, redaktura mašinskog prevoda je i dalje „profesija u nastajanju“. [8] Koji je pravi profil redaktora mašinskog prevoda još uvek nije u potpunosti istraženo. Redaktura mašinskog prevoda se poklapa sa prevođenjem i uređivanjem, ali samo delimično. Većina misli da će idealni redaktor mašinskog prevoda biti prevodilac koji želi da se obuči za određene potrebne veštine, ali postoje neki koji misle da će biti lakše obučiti za ovo bilingvalnu osobu koja nema formalno prevodilačko obrazovanje. [9] Ne zna se mnogo ni o tome ko su zaista trenutni redaktori mašinskog prevoda, da li su oni profesionalni prevodioci, rade li uglavnom kao zaposleni u preduzećima ili samozaposleni i pod kojim uslovima. Mnogi profesionalni prevodioci ne vole redakturu mašinskog prevoda, između ostalog i zbog toga što se obično plaća po nižim stopama od konvencionalnih prevoda, pri čemu je Međunarodno udruženje profesionalnih prevodilaca i tumača (International Association of Professional Translators and Interpreters - IAPTI) bilo posebno izričito po ovom pitanju. [10]

Kvalitet izlaza mašinskog prevođenja radi redakture je viši i stoga zahteva manje napora nakon redakture onda kada mašinsko prevođenje proizvede neuralni, vertikalni ili prilagođeni mehanizam mašinskog prevođenja . Poboljšanje efikasnosti prevoda može se meriti praćenjem vremena koje je lingvistima potrebno da isprave mašinski prevod u istom prevodilačkom okruženju, kao što je HTM Klaud [11], sistem za upravljanje prevođenjem i alat za računarski potpomognuto prevođenje, gde se mogu porediti vreme za redakturu mašinskog prevoda i rezultati procena lingvističkog kvaliteta redigovanih tekstova.

Ne postoje jasni podaci o tome koliko je veliko tržište redakture mašinskog prevoda u prevodilačkoj industriji. Nedavno istraživanje je pokazalo da to nudi 50% pružalaca jezičkih usluga, ali za 85% njih ova usluga čini manje od 10% njihovog rada. [12] U Memsoursu, veb alatki za prevođenje, tvrde da je preko 50 posto prevoda između engleskog i španskog, francuskog i drugih jezika urađeno preko njihove platforme kombinujući prevodilačku memoriju sa mašinskim prevođenjem. [13] Redaktura mašinskog prevoda se vrši i putem portala za kraudsoursing prevođenje (prevođenje putem angažovanja većeg broja spoljnih saradnika) kao što je Unbabel koji tvrdi da je do novembra 2014. redigovao preko 11 miliona reči mašinskog prevoda. [14]

Procene produktivnosti i obima su u svakom slučaju ciljevi koji se menjaju, jer će napredak u mašinskom prevođenju, u značajnom delu vođen tekstom nastalim nakon redakture mašinskog prevoda koji se zatim vraća u mašinu, značiti da što više redaktura mašinskog prevoda bude urađeno, to će biti bolji kvalitet mašinskog prevođenja i redaktura mašinskog prevoda će postati rasprostranjenija[traži se izvor]

Vidi još

uredi

Reference

uredi
  1. ^ „Senez, Dorothy. "Post-editing service for machine translation users at the European Commission". Translating and the Computer 20. Proceedings from Aslib conference, 12 & 13 November 1998; Vasconcellos, M. and M. Léon (1985). "SPANAM and ENGSPA: Machine Translation at the Pan American Health Organization". Computational Linguistics 11, 122-136.”.  Nedostaje ili je prazan parametar |url= (pomoć)
  2. ^ „Allen, Jeffrey. "Post-editing", in Harold Somers (ed.) (2003). Computers and Translation. A translator's guide. Benjamins: Amsterdam/Philadelphia, p. 312.”.  Nedostaje ili je prazan parametar |url= (pomoć)
  3. ^ „TAUS website”. YouTube. 
  4. ^ „Loffler-Laurian, Anne marie. (1986). Post-édition rapide et post-édition conventionelle: deux modalities d'una activité spécifique¨. Multilingua 5, 81-88.”.  Nedostaje ili je prazan parametar |url= (pomoć)
  5. ^ „Wagner, Elisabeth. "Rapid post-editing of Systran" Translating and the Computer 5. Proceedings from Aslib conference, 10 & 11 November 1983.”.  Nedostaje ili je prazan parametar |url= (pomoć)
  6. ^ Green, Spence, Jeffrey Heer, and Christopher D. Manning (2013). „The Efficacy of Human Post-Editing for Language Translation” (PDF). ACM Human Factors in Computing Systems. 
  7. ^ Plitt, Mirko and Francois Masselot (2010). „A Productivity Test of Statistical Machine Translation Post-Editing in A Typical Localisation Context” (PDF). Prague Bulletin of Mathematical Linguistics. 93: 7–16. S2CID 10572876. doi:10.2478/v10108-010-0010-x. 
  8. ^ „TAUS website”. Arhivirano iz originala 12. 08. 2016. g. Pristupljeno 01. 11. 2020. 
  9. ^ Hutchins, John (1995). „Reflections on the History and present state of machine translation” (PDF). Arhivirano iz originala (PDF) 06. 11. 2020. g. Pristupljeno 01. 11. 2020. 
  10. ^ „IAPTI website”. Arhivirano iz originala 07. 02. 2017. g. Pristupljeno 01. 11. 2020. 
  11. ^ „XTM International official website”. 
  12. ^ „Postediting in Practice. A TAUS Report.” (PDF). mart 2010. str. 13. Arhivirano iz originala (PDF) 22. 01. 2022. g. Pristupljeno 01. 11. 2020. 
  13. ^ „Memsource website”. Arhivirano iz originala 25. 09. 2016. g. Pristupljeno 01. 11. 2020. 
  14. ^ „Unbabel Launches A Human-Edited Machine Translation Service To Help Businesses Go Global, Localize Customer Support”. 23. 3. 2014. 

Dodatna literatura

uredi

Spoljašnje veze

uredi