Ugrás a tartalomhoz

Szerkesztő:Apród/Gépi fordítás - készülő wikiesszé

A Wikipédiából, a szabad enciklopédiából

Amik jelenleg hasznosíthatók a gépi fordításról a Magyar Wikipédián belül (irányelv/szócikkek): Wikipédia:Mi nem való a Wikipédiába? 24. pontja, Gépi fordítás, Google Fordító#Fordítási hibák és furcsaságok.

A Google Fordító#Fordítási hibák és furcsaságok csak részben adja vissza, mi a baj a Google Fordítóval. Fontos volna kibővíteni, miért számítanak rossz mondatnak, mert a "statisztikai módszertan" kifejezés használata csak eltakarja az okokat, amik miatt a Google Fordító használhatatlan elsődleges nyelvi forrásként Magyarországon. Én inkább csak az okozatokat, következményeket látom leírni a szócikkben, nem az okokat (az ilyenek nem derülnek ki belőle pl. kereken: magyar nyelv eltérő sajátosságai a többi ország nyelvétől; mivel mások fordítási javaslatokat is hozzáadhatnak, melyek bekerülnek a következő változatba, önszórakoztatásból is megváltoztathatják egy szó értelmét; a Google számára se értelmezhető valójában minden szó stb.).

Szívesen várok hozzászólásokat/kiegészítéseket mástól is, részben arra, hogy a gépi fordításban - magyar nyelven beszélő ember számára is szemmel látható hibái ellenére - miért hisznek mégis sokan, egyáltalán sokan hisznek-e benne a tapasztalatok szerint vagy csak időnként fel-fel tűnik néhány gépi fordítást alkalmazó szerkesztő? Mentalitás kérdése is vagy csak téves következtetésekből indul ki? Van-e olyan eszköz, amellyel a gépi fordítást alkalmazó egyént jobb belátásra lehet bírni? Ha gépi fordításban készült idegen nyelvű szöveget kijavítanak mások, akkor a szócikkek gépi fordítását alkalmazó szerkesztők tanulnak a mások javításából valamit (vagyis jobb minőségű szócikket készítenek-e utána idegen nyelvű anyagból) vagy sem? Vagy ez attól függ, hogyha az illető nyelvnek nem is minden szavával, de pl. személyes névmásaival, ragozási rendszerével tisztában vannak-e?

Másfelől a járőröknek milyen gyakorlati tapasztalataik vannak? Miért vontak le időnként egy-egy gépi fordítás esetében más-más következtetéseket (vagyis ki azonnali törlést alkalmazott, ki gépi fordításra utaló sablont, ki törlési eljárásra vivést)? Melyik vajon a jobb megoldás? Ha mindhárom megoldás jó, mikor jó az első (azonnali törlés), mikor a második (gépi fordítás sablonja), mikor a harmadik variáció (törlési eljárás)?

Egyébként annak idején a gépi sablon törlése is felmerült, de volt olyan, aki azt javasolta, bízzuk a természetes szelekcióra. és a sablont az mentette meg, hogy nem volt róla konszenzus:Wikipédia:Törlésre_javasolt_lapok/Sablon:Gépi.

Példák az elmúlt évek gépi fordításához kapcsolódó érdekesebb vagy hasznosabb hozzászólásokból

[szerkesztés]

0 és 1 óra között (24 első évad) törlési megbeszélése: A "gépi fordítás" egy új szitokszó itten vagy mi? :-o Kapjatok a fejetekhez! Dollármilliókat keresne aki ilyen minőségű fordítást produkáló programmal tudna kirukkolni! Ha ez a szöveg gépi lenne, a világon mindenhol bekereteznék és mutogatnák, mint korszakalkotó áttörést. Ez csak egy satnya humán fogalmazás, stilisztikailag nulla, de nyelvtanilag teljesen elfogadható. Próbáljunk már kicsit korrektebbek lenni, kéremszépen! Bitman (2009. augusztus 9., 20:22)


Kocsmafali (egyéb): gépi fordítás: Eddig úgy tudtam, hogy a gépi fordításokat azonnali törlésre jelöljük. Most vettem észre, hogy van egy {{gépi}}(?) sablon, ami a gépi fordítást jelöli. Ez úgy működik, mint a szubcsonk, hogy x idő után törlődik, mármint ha nem javítja senki, vagy csak úgy van? --Hkoala 2012. június 24., 19:43

Én azonnaliznám az összeset. A gépi fordítás túlnyomó többsége annyira értelmetlen, hogy javítani sem érdemes. Max az ilyen 2-3 soros kis cikkecskéken tudom ezt a sablont elképzelni, ahol még nem akkora munka javítgatni a fordítógép magyartalanságait. Hosszú szöveget azonnalira kell rakni, mert átnézni, összevetni az eredetivel és javítgatni túl sok fölösleges energia. Teemeah 2012. június 24., 19:50

Érdekes olvasmány ez is: Wikipédia:Törlésre javasolt lapok/Sablon:Gépi. Én mindenesetre a gépi fordításokat azonnali eljárásban törlöm. Malatinszky 2012. június 24., 20:13

megjegyzés Egy kicsit olyasmi ez a helyzet, mint a {{Nevezetesség}}(?) sablonnál is: megkérdőjeleződik az értelme. Amazt én már nemegyszer alkalmaztam szócikkekre kitéve, de kérdés, hogy van e értelme neki, ha – és egyébként szinte mindig – valaki utána meg nem állja meg, és TMB-re viszi a cikket. – Joey 2012. június 24., 20:45

Amikor feltettem a kérdést, akkor négy cikken volt rajta a sablon, az egyiken elég régóta. Szerintem csak a szubcsonkhoz hasonló átmeneti türelmi idővel lenne értelme ennek a sablonnak. --Hkoala 2012. június 24., 21:25

Én egyre türelmesebb vagyok velük. Egyrészt egyre jobb minőségűek, másrészt gyakran csak két-három perc olyan szintre hozni a csonkot, hogy tisztességesen megálljon, mint csonk. A trágyát természetesen én is azonnaliban törlöm. – Burumbátor 2012. június 24., 21:53

Mérlegelni kell. Van, amikor tényleg csak pár szót kell javítani, de olyna gépi fordítást is láttam, hogy nulla értelme nem volt, cska szóhalmaz. Én is amellett lennék, hogy ez a sablon a szubcsonkhoz hasonlóan időbélyeges legyen, és 5 nap múlva, ha nem javítja a gazdája, akkor törlendő. Ha valaki nem veszi a fáradságot, hogy kijavítsa amit kidobott neki a google fordító, és értelmes mondatokat alkosson belőle, annak annyira nagyon nem hiányzik az a szócikk... Google lefordíttatni 5 mondatot és feldobni szemétnek ide fél perc (se). Ha annyi energiát nem feccöl bele, hogy értelmesre átírja, akkor kuka. Nem hiányzik a tripla munka senkinek. Legyen időbélyeges, öt napos, mint a szubcsonksablon és listázódjon a törlendők lapon, ahogy a szubcsonk. Teemeah 2012. június 24., 22:12

Egyetértek. És pont volt egy szerkesztő (nem is anon, csak nem akarom visszakeresni), aki két vagy három volt koreai alelnök cikkét nyomta fel, két vagy három elütésszintű hibával. De tény, hogy a 80% – rubbish. – Burumbátor 2012. június 24., 22:16

Kim Jongszam és Kim Szongszu voltak azok, a mai nap pofoztam ki őket. Mondjuk azért nagy jóindulat kell ahhoz, hogy az „1993–1998 14. között államfője dél-koreai.” mondatra azt mondjuk, hogy elütésszintű hiba. :-) Volt még egy koreai filozófus (ezt meg én nem keresem vissza), ami viszont tök értelmetlen volt, azt azonnaliztam is. Szóval igen, tényleg kell a mérlegelés, de ahhoz szükséges volna valamit ezzel a gépi sablonnal kezdeni, akár a szubcsonk mintájára, mint javasolták. – Laci.d 2012. június 24., 22:31

Megint csak nem mondunk ellent egymásnak. A gépiek nagy része használhatatlan. De minél rövidebb a cikk, annál kevesebb erőbefektetéssel készíthető belőle a számunkra is elfogadható csonk vagy szubcsonk. – Burumbátor 2012. június 24., 22:39

Hogy a kecske és a káposzta is, a törlési megbeszélésen átesett sablon mostantól a WP:AT alkategóriájába sorolja a megjelölt lapokat, hogy el ne kallódjanak. Ettől még kerülhet rájuk időbélyeg, hiszen a szubcsonk is így működik. Bináris Kelt: Wikipédia, 2012. június 24., 23:50


Járőrök üzenőfala: Gépi, szoftveres fordítás: Mit kell csinálnom egy teljes egészében gépi fordítással készült, számos ponton megérthetetlen szócikkel? (Agnes Monica) Maga a cikk nem lenne hülyeség, de ennek így mélyütésszerű hatása van. - Orion 8 2013. április 11., 14:49

:Vagy nekiállsz kijavítani :-) vagy megjelölöd a {{gépi}}(?) vagy {{gépi fordítás}}(?) sablonokkal. Illik a szerkesztőt is figyelmeztetni, illetve megkérni a javításra (erre általában nem sok esély van...) – Rlevente 2013. április 11., 16:27

:WP:NEM, 24-es pont --> {{azonnali}}(?) --Hkoala 2013. április 11., 16:31

:Ha a huwikin törlésre kerül a cikk, a Wikidatából is törlődik? --Rlevente 2013. április 11., 17:20 ::A kérdés nagyon jó! ::Nem, nem törlődik, a cikket törlő adminisztrátornak kell a Wikidatából való visszahivatkozást eltávolítani! --Joey 2013. április 11., 17:48

Köszönöm. - Orion 8 2013. április 11., 23:25


Lamarit: Igen, én is észrevettem, hogy az utóbbi időben Lamarit megad egy bizonyos, magyar nyelven kiadott könyvet. Már terveztem a beszerzését, de aztán feleslegesnek ítéltem, ugyanis teljesen nyilvánvaló, hogy a forrás - Alyse(Szerk.) Dar: USA - Országúton. KOSSUTH KIADÓ ZRT.. 2012. ISBN ISBN 9789630965934 - valótlan, hiszen a a cikkek az angol wiki tükörfordításai, soha egyetlen alkalommal sem került bele ahhoz képest többletinformáció.--Kisregina 2013. június 3., 18:09

[...]

hhgygy álláspontja

Nem tudok sokat hozzátenni, csak annyit, hogy még az sem megoldás, ha nem fordít, csak ír cikkeket, ugyanis az alapvető (magyar) helyesírási szabályokkal sincs tisztában, és ha erre figyelmeztetik, arra hivatkozik, hogy ez az akadémikusok szórakozása, meg hogy "ezt mások is összevissza írják". Ez pedig nem fordítástechnikai kérdés. Azonkívül általános probléma, hogy a wikipédia normáival sincs tisztában, a linkeket sem ellenőrzi, és mivel nem írja helyesen, tele van döglött linkekkel ott is, ahol egyébként lenne már megfelelő magyar cikk. --hhgygy 2013. május 25., 14:34

[...]

Ellenőrzött, de (az utóbbi kb. 30) kivétel nélkül korrektúrát és szakmai ellenőrzést igénylő sablonnal, mivel hemzsegnek benne az alapvető helyesírási hibák (különírás-egybeírás nem megy és nem is hajlandó foglalkozni ennek rejtelmeivel, másrészt az arch volt már kőhíd, boltív(!) és még kitudja micsoda - ehhez én sem értek, félreértés ne essék, no és a rengeteg szórakoztató lejterjakab, mint például a legutóbbi "kellékváros"- no, mi az?)--hhgygy 2013. május 27., 18:01

Ezt most nem értem, hogy jön ide: Lamarit egy élő szerkesztő (volt), aki sem magyarul sem angolul nem tudott megfelelő szinten. De itt nem a gépi fordításról lenne szó?--hhgygy óhaj, sóhaj, panasz? 2013. október 20., 10:12 (CEST)

De. Csak a gépi fordítás (legalábbis a magyar nyelvről más nyelvre, más nyelvről magyarra fordítás esetében biztosan) és a rosszul fordító között megvan az a párhuzam, hogy mindkét esetben a rosszul fordító személy nem képes átlátni a mondaton belüli, szavak közötti logikai összetevőket, vagyis a gépi fordítás előnyéről (amennyiben van) és hátrányairól is csak annak lehet összbenyomása, aki több, mint "kicsit jól" vagy pedig nagyon jól tud fordítani. Én például nem tudok svédül, úgyhogy gépi fordítás esetében sem tudnék háromsoros svéd szövegből fordítani, mert ahhoz nemcsak a főneveket kellene értenem (ezt pontosan tudom, mert néhány hónappal a Wikibe jövetelem után egy volt svéd herceg svéd nyelvű szócikkéből egy mondatot megpróbáltam megérteni gépi fordítással, aztán mivel nem értettem, először fordítási segítséget kértem egy olyan szerkesztőtől, aki azelőtt segítségét ajánlotta fel, ha kell, ám mivel hallgatás volt rá a válasz, feladtam a mondattal való próbálkozást és angol forrásokat vettem továbbiakban alapul). Apród vita 2013. október 20., 18:55 (CEST)

A gépi fordításról általában

[szerkesztés]

A gépi fordításról pedig általában: én közel 30 éves fordítói tapasztalattal igen szkeptikus vagyok, de megszorításokkal: ugyanis azt tapasztalom, hogy az indoeurópai nyelvek közötti gépi fordítás meglepően jó minőségű, például a spanyolból, franciából vagy portugálból angolra fordított (hétköznapi jellegű) szövegek nagyon kevés gyomlálást igényelnek. A magyarról angolra és angolról magyarra fordítások gépi eszközökkel szinte használhatatlanok a magyar szórend, a ragozás (vagy nem tudom mi) miatt. (Érdekes módon, még a németben látom, hogy nem tudják megoldani a nyelv speciális szerkezete (Satzrahmen) miatt a megfelelő szemantikai elemzést, és sokszor "mellémegy" a németről angolra fordítás is). Senki sem lát a jövőbe, mivel szkeptikus vagyok, az is belefér, hogy egyszer majd megoldják ezt is, de ehhez valószínűleg olyan robotokat kell előállítani, akik valóban "gondolkodnak", mint egy ember, de akkor viszont nem lesz szükség wikipédiaszerkesztőkre sem :-)

A lényeg: a fordítóautomaták jelenlegi szintje egy enciklopédia céljaira elfogadhatatlan minőségű fordítást ad bármely idegen nyelvű szövegből magyarra és vice versa.--hhgygy óhaj, sóhaj, panasz? 2013. október 20., 10:22 (CEST)

Itt is felteszem a kérdést, ahogy ezt a készülő wikiesszé vitalapján is feltettem Teemeah válaszát követően: És megítélésed szerint a magyar Wikipédia szerkesztőinek összmennyiségéhez mérten kevés vagy sok gépi fordítást alkalmazó szerkesztő van, aki gépi fordítást alkalmaz? Másrészt pedig a gépi fordítást alkalmazó szerkesztők száma évi mennyiségben csökkenő, egyenletes vagy növekvő mennyiséget mutat? És honnan lehet megkülönböztetni kapásból a rosszul fordító személyt a gépi fordításból dolgozótól?

Ha gépi fordításban készült idegen nyelvű szöveget kijavítanak mások, akkor a szócikkek gépi fordítását alkalmazó szerkesztők tanulnak a mások javításából valamit (vagyis jobb minőségű szócikket készítenek-e utána idegen nyelvű anyagból) vagy sem? Vagy esetleg mentalitás kérdése is, hogy tanulnak-e belőle valamit? Apród vita 2013. október 20., 19:30 (CEST)

Ezek olyan kérdések, amikről fogalmam sincs. Aki gépi fordítást ad be wikipédiacikknek, az sarlatán, kontár, szélhámos, de mondhatnám azt is, hogy gazember. Csak véleményt tudok mondani. Én már azt sem értem, hogy mi értelme volt felhozni pl. a svéd vagy a lengyel wikipédiát 1 000 000 cikkre, nézd meg véletlenszerű kiválasztással, hogy mik vannak ott. Persze, hogy gépi fordítással a magyar wikipédia is simán tarthatna az 500 000. cikknél. Ennek így semmi értelme, vagyis annyi, mint Rákosi idején a sztahanovistáknak, még több selejtet gyártottak adott idő alatt.--hhgygy óhaj, sóhaj, panasz? 2013. október 20., 21:02 (CEST)