przedruk - tłumaczenie przeglądarki
26 grudnia 2020 r
Czy technologia położy kres globalnej dominacji języka angielskiego?
Gary Parkinson
Język to skomplikowana rzecz, często używana do prostych celów: komunikowania się, ostrzegania, zabiegania o względy, handlu, nauki. Jej rozwój może ukazać historię w miniaturze, ale odcisnąć duże znaczenie na wydarzeniach na świecie.
Weźmy na przykład wyrażenie „lingua franca”. Oznacza to, że każdy język używany przez tych, którzy nie mają wspólnego języka, może być pidgin lub kreolskim korupcją lub połączeniem dwóch języków, opracowanym między stronami z wzajemną potrzebą zrozumienia - w handlu lub komunikacji.
Tak było w przypadku oryginalnego lingua franca - języka pidgin lub kombinacji, którego używali w połowie ubiegłego tysiąclecia kupcy i dyplomaci na całym wschodnim Morzu Śródziemnym. Oparta na uproszczonych włoskich, ale zapożyczonych słowach z portugalskiego, hiszpańskiego, francuskiego, greckiego, tureckiego i arabskiego, ta pierwsza lingua franca została nazwana - być może ironicznie, być może trafnie - imieniem Franków: ludów germańskich, których imię było używane, przez ludy bizantyjskie Imperium, reprezentujące wszystkich mieszkańców Europy Zachodniej.
Z drugiej strony, lingua franca może być językiem narzuconym z góry, albo dobrowolnie, gdy pewna kultura dominuje przez pierwszeństwo w okresie formacyjnym - na przykład standardowe użycie włoskiego w operach i notacji muzycznej lub francuskiego w balecie - lub mocniej w ramach wojskowej kampanii ujarzmienia i kontroli.
To nałożenie wyjaśnia znaczenie angielskiego jako jednego z najczęściej używanych języków na świecie. Imperium brytyjskie zaczęło używać go na całym świecie, a nawet w fazie post-imperialnej wiele byłych kolonii nadal używało go jako podstawowego języka, często jako jednoczącej płaszczyzny wspólnej ponad mnogością języków tubylczych. A gdy to imperium upadło, inna kultura anglojęzyczna wyrosła na światowy prym.
„Niezależnie od tego, jak na to spojrzeć, angielski jest dominującym językiem na świecie” - mówi Gaston Dorren CGTN Europe - i powinien wiedzieć, jako autor lingwistyczny, który mówi w sześciu językach, może czytać kolejnych dziewięć i napisał książki w kilku z nich .
„To z powodu bardzo udanej przeszłości kolonialnej, niezależnie od tego, jakie masz zdanie” - mówi. „Ale to także z powodu bardzo dominującej kultury amerykańskiej, poprzez Hollywood, z powodu amerykańskiej potęgi militarnej, potęgi gospodarczej, II wojny światowej i tak dalej”.
Ponieważ komunikacja i transport skurczyły się na świecie, język angielski stał się światowym lingua franca. Jak ujął to Dorren: „W ostatnich dziesięcioleciach, kiedy amerykańska dominacja gospodarcza, kulturowa, polityczna i militarna zbiegła się z globalizacją, język angielski stał się językiem domyślnym praktycznie we wszystkich dziedzinach globalnej komunikacji, od kina i muzyki pop po naukę i lotnictwo cywilne”.
20 najlepszych języków świata według liczby użytkowników
Angielski 1,5 mld
Mandarynka 1,3 mld
Hiszpański 575m
Hindi-urdu 550m
Arabski 375m
Bengalski 275m
Portugalski 275m
Rosyjski 275m
Malajski 275m
Francuski 250m
Niemiecki 200m
Suahili 135m
Japoński 130m
Pendżabski 125m
Perski 110m
Jawajski 95m
Turecki 90m
Tamil 90m
Koreański 85m
Wietnamczyk 85m
Źródło: Babel , Gaston Dorren
Twój komputer mówi po angielsku
Mógł dodać technologię komputerową. Podczas gdy starsze nauki ścisłe czerpią swoje słownictwo z tego, co Europejczycy uważają za „klasyczne” języki łaciny i greki, informatyka - dorastając w tym, co wielu nazywa „stuleciem amerykańskim” - jest w dużej mierze oparta na języku angielskim… i dlatego też architektura internetu.
W 2019 roku Gretchen McCulloch, lingwistka i autorka bestsellerowego New York Timesa, ponieważ Internet: rozumienie nowych reguł języka , odkryła, że „oprogramowanie i platformy mediów społecznościowych są obecnie często dostępne w około 30–100 językach”. Nie brzmi to źle, dopóki nie zdasz sobie sprawy, że na planecie mówi się i podpisuje w 6000 lub 7000 językach.
Ponadto McCulloch znalazł głębszy problem, który Karol Marks mógłby nazwać środkami produkcji: „A co z narzędziami, które czynią nas twórcami, a nie tylko konsumentami, narzędzi obliczeniowych? Znalazłem cztery języki programowania, które są szeroko dostępne w wielu językach wersje. Nie 400. Cztery (4). "
Podczas gdy same komputery są niezależne od języka, platformy, na których działają, nie są, co stwarza barierę dla ogromnych połaci świata. Jak zauważył McCulloch, „Nawet ogromne języki, które mają rozległe tradycje literackie i są używane jako regionalne języki handlowe, takie jak mandaryński, hiszpański, hindi i arabski, nadal nie są szeroko rozpowszechnione jako języki kodu”.
Jednak dzięki pionierom komputerów pracującym głównie w Wielkiej Brytanii, a następnie w Stanach Zjednoczonych, język angielski stał się niemal domyślnym lingua franca informatyki. Chociaż może to ograniczać się do osób nie mówiących po angielsku, które chcą karierę w programowaniu, może to mieć wpływ na znacznie szerszą populację: w istocie każdy, kto chce korzystać z komputera lub Internetu, musiał czekać na „dostosowany” wersja pasująca do ich języka.
Nie zawsze było to tak szybkie, jak można się spodziewać. Wczesne komputery były ograniczone przez ASCII (American Standard Code for Information Interchange), oparty na języku angielskim schemat kodowania znaków wprowadzony w 1963 roku i ograniczony do 128 opcji.
„Angielski jest językiem ojczystym internetu” - mówi Dorren. „Komputery pochodzą z Wielkiej Brytanii, potem nowoczesne komputery pochodzą ze Stanów Zjednoczonych, a internet, jak sądzę, powstał w Europie, z pewnością rozkwitł z Doliny Krzemowej. Próbuję sobie wyobrazić, co by się stało, gdyby internet zaczął się w Niemczech lub Francja - jestem pewien, że widzielibyśmy inną trajektorię. "
Bardzo krótka historia technologii komunikacyjnej opartej na języku angielskim
Taka anglocentryczność nie jest niczym nowym w technologii rozpraszania języka. ASCII został opracowany z kodu telegraficznego, który sam został potępiony za brak liter z akcentami i innymi znakami diakrytycznymi - glify, które uzupełniają litery alfabetu łacińskiego, takie jak cedilla (ç), tylda (ñ) lub umlaut (ü). Są one prawie znikome w języku angielskim w porównaniu z innymi językami używającymi alfabetu łacińskiego, nie mówiąc już o innych zestawach liter lub znaków.
Podobnie układ maszyny do pisania QWERTY został stworzony w 1873 roku przez amerykańskiego redaktora gazety Christophera Lathama Sholesa - chociaż pominął cyfry 0 i 1, licząc duże O i zamiast tego mogłem wykonywać te prace. Bardziej trafnie na większości planety projekt nie uwzględniał akcentów, znaków diakrytycznych i innych zestawów znaków.
Ci, którzy używali różnych alfabetów, musieli albo wymyślić własny sprzęt (taki jak nowe układy klawiatury) lub zestawy znaków (takie jak przyjazna dla umlautów wersja amerykańskiego Samuela Morse'a, zatytułowana, ale pozbawiona znaków diakrytycznych) lub po prostu zgodzić się do zanglicyzowanych alternatyw.
Chociaż świat się zglobalizował, sytuacja ta nie uległa poprawie w czasie. Podczas gdy wynalazcy nieanglojęzyczni mogli budować własne maszyny do pisania, a szerszy kod Gerke wkrótce zastąpił alfabet Morse'a, ASCII pozostał standardem w sieci do 2008 roku - dlatego nazwy domen przed ostatnią dekadą były ograniczone do znaków angielskich.
To pierwszy przypadek, gdy jeden język jest lingua franca na całym świecie. Jest wiele dziedzin, na których możemy o tym tylko pomarzyć
- Gaston Dorren
„Istnieje różnica między obecnym statusem języka angielskiego a statusem wszystkich innych lingua francas, które miały miejsce wcześniej: po raz pierwszy jeden język jest lingua franca na całym świecie” - mówi Dorren. Uważa, że pod pewnymi względami nie jest to zła rzecz - a na pewno nie tak destrukcyjna, jak idea, by jakikolwiek inny język stał się tak dominujący.
„Jest wiele dziedzin, w których możemy o tym tylko pomarzyć. Wystarczy pomyśleć o gniazdkach: podróżujesz za granicę i potrzebujesz różnego rodzaju adapterów do podłączenia komputera. Gdybyśmy mieli jeden typ gniazdka, a potem ktoś powiedziałby:„ Nie, wiesz co, teraz jestem dominujący, chcę to zmienić, „nie dostosowywalibyśmy się, nie robilibyśmy tego. Myślę, że to samo dotyczy języka”.
Alfabety i inne dane wejściowe
Język może wiele zdziałać z odpowiednią pomocą. Imperium rzymskie rozpowszechniło alfabet łaciński w dużej części Europy; sam język łaciński stał się podstawą języka włoskiego, francuskiego, hiszpańskiego, portugalskiego i rumuńskiego, z dalszym wpływem na język niderlandzki, norweski, duński, szwedzki, a zwłaszcza angielski.
Z kolei te bardziej nowoczesne języki europejskie - i wspólny alfabet - rozprzestrzeniły się na całym świecie w drugiej połowie ubiegłego tysiąclecia, do tego stopnia, że alfabet łaciński jest obecnie używany przez około 70 procent światowej populacji.
Ekspansja kulturowa nadal odbywa się teraz poprzez zapożyczenia, które przybywają do jednego języka z innego bez tłumaczenia (przetłumaczone słowa lub wyrażenia nazywane są kalkami), reprezentując w ten sposób małą placówkę językową w obcym języku.
Nie zawsze są mile widziani; Academie Française długo i ciężko walczyła przeciwko pełzającej anglicyzacji języka francuskiego - jeśli nie zawsze z sukcesem. Dominacja kultury prowadzonej przez Stany Zjednoczone - w rozrywkowych kanałach muzycznych, filmach i telewizji, ale także w świecie komercyjnym o coraz większej marce - doprowadziła do ciągłego „kulturowego pełzania”.
Niecałe sto lat temu turecki (obecnie używany przez 90 milionów) przeszedł od pisma perskiego / arabskiego do niestandardowej wersji alfabetu łacińskiego, zmieniając wiele słów w słowniku. Ten niezrównany akt rewolucji leksykalnej jednocześnie ponownie wyraził dumne dziedzictwo Turcji - wiele starych zapożyczeń zostało porzuconych, albo dla synonimów regionalnych dialektów, albo po prostu dla neologizmów opartych na tureckich korzeniach - jednocześnie zmieniając spojrzenie kulturowe kraju ze wschodu na zachód.
Mimo to około 30 procent świata nie używa alfabetu łacińskiego. Książka Gastona Dorrena Babel bada każdy z 20 najpopularniejszych języków świata, z których dokładnie połowa korzysta ze skryptów innych niż łaciński: koreański (używany przez 85 milionów), tamilski (90 milionów), perski (110 milionów), pendżabski (125 milionów), Japoński (130 milionów), rosyjski (275 milionów), bengalski (275 milionów), arabski (375 milionów), hindi / urdu (550 milionów) i mandaryński (1,3 miliarda).
W przypadku tych ogromnych obszarów planety domyślne łacińskie ABC w Internecie nie ma znaczenia. Coraz popularniejszym produktem ubocznym tego podziału jest pinyin - „zratynizowany” system przedstawiania chińskich znaków. Chociaż pierwotnie opracowany przez chińskich lingwistów w latach pięćdziesiątych XX wieku, pinyin (dosłownie „dźwięk zaklęcia”) został wzmocniony przez najnowsze postępy technologiczne, w których priorytetem jest alfabet łaciński.
Ale czy nie jest to kolejny przykład kulturowego pełzania, anglofońskiej dominacji ukradkiem? Nie dla Dorrena, który wątpi w zdolność świata do nauki chińskiego, ale z zadowoleniem przyjmuje wszelkie pomosty między użytkownikami różnych języków.
Mogę sobie wyobrazić informacje online w języku chińskim automatycznie przepisywane na pinyin - tak jak serbskie strony internetowe automatycznie dokonują transliteracji między łaciną a cyrylicą
- Gaston Dorren
„Pinyin to zdecydowanie dobra rzecz z wielu powodów” - mówi. „Jeśli mandaryński odniesie większy sukces na arenie międzynarodowej, niż się szczerze spodziewam, pinyin byłby doskonałym interfejsem. Mogę sobie wyobrazić, że informacje online w języku chińskim będą automatycznie przepisywane na pinyin - podobnie jak serbskie witryny internetowe automatycznie dokonują transliteracji między łaciną a cyrylicą, co robią nienagannie.
„Byłoby to możliwe w przypadku pinyin, ponieważ system działa w taki sposób, że nie byłby zbyt skomplikowany. Komputer nie ma problemu z zapamiętaniem 6000 lub 10 000, a nawet niesławnych 50 000 znaków [w języku chińskim mandaryńskim]. Komputer może to zrobić : tylko my, biedni, mokrzy ludzie, nie dajemy rady ”.
Jednak my, biedni, mokrzy ludzie, możemy zarządzać naszymi ręcznymi komputerami, korzystając z innej powstającej technologii, która jest całkowicie wolna od klawiatury: wprowadzanie głosu. Badania sugerują, że około połowa wszystkich wyszukiwań odbywa się teraz za pomocą poleceń głosowych, do czego przyczyniła się popularność asystentów głosowych, takich jak Echo, Alexa i Siri.
Korzystając z technologicznego koktajlu uczenia maszynowego i przetwarzania języka naturalnego (NLP), technologie te automatycznie określają język mówiony - lub języki, bez wysiłku przełączając się z jednego na drugi, co jest tak często konieczne, biorąc pod uwagę, że tylko 40 procent świata jest jednojęzyczne.
Domeny i języki
W międzyczasie architektura internetu z opóźnieniem otwiera się na znaki spoza alfabetu łacińskiego. „Ludzie, którzy używają różnych alfabetów - cyrylicy, koreańskiego lub mandaryńskiego, chińskich znaków, indyjskich pism - dziś wszyscy mogą używać tych alfabetów na swoich komputerach, smartfonach i tabletach” - mówi Dorren.
„Rozmawiałem z facetem z Google, którego zespół bardzo ciężko pracował, tworząc dziesiątki indyjskich skryptów, aby tablety, komputery i smartfony były dostępne dla ludzi i aby nie musieli pisać po angielsku lub być może w hindi. Monopol został z pewnością złamany i Twoje i moje wrażenie, że to wszystko po łacinie w Internecie, może być trochę zaściankowe, ponieważ tam się wybieramy.
Rzeczywiście, Indie - ogromny rynek z być może oszałamiającym wachlarzem języków liczącym tysiące - znalazły się w czołówce, jeśli chodzi o zakończenie upartego uprzedzenia w kierunku alfabetu łacińskiego w ogóle, a zwłaszcza języka angielskiego.
W listopadzie 2019 r.Med Manish Maheshwari z Twitter India z dumą ogłosił, że jego szybko rozwijająca się platforma jest teraz mniej niż w połowie angielska, po dodaniu opcji preferowanego języka, aby pomóc algorytmom w wyświetlaniu treści specyficznych dla użytkownika.
„Czuliśmy, że rozwiązywanie problemów językowych w Indiach będzie bardzo ważne” - powiedział Maheshwari. „Już teraz tweety w języku innym niż angielski stanowią 50 procent wszystkich tweetów. Widzieliśmy to w ciągu ostatnich sześciu do ośmiu miesięcy z powodu zmian, jakie wprowadziliśmy w produkcie”. Twitter India współpracował również z 70 partnerami medialnymi przy przyswajaniu lokalnych treści i rozpoczynaniu rozmów.
W 1998 roku około 85% treści online stanowiło język angielski, w 2018 było to około 20%. Oczekuje się, że osiągnie około 10%
- Vasco Pedro, CEO platformy tłumaczeniowej Unbabel
W międzyczasie od 2010 roku projekt Internationalized Domain Names (IDN) uwolnił Internet od jego pęt ASCII i udostępnił 152 domeny najwyższego poziomu (bit po kropce, jak .com lub .net), w tym 75 w skryptach chińskim, japońskim lub koreańskim. plus 33 w alfabecie arabskim. Obecnie istnieje ponad dziewięć milionów zarejestrowanych domen IDN, co stanowi około jedną na 40 całkowitej liczby domen na świecie - i szybko rośnie.
Badanie przeprowadzone przez Radę Europejskich Krajowych Rejestrów Domen najwyższego poziomu i Oxford Information Labs sugeruje, że takie dostosowane domeny „zwiększają obecność lokalnych języków w Internecie i wykazują niższy poziom znajomości języka angielskiego niż w sektorze nazw domen na całym świecie”.
Ten impuls może uratować te spośród około 6000 języków świata, którym dominacja języka angielskiego może grozić wyginięciem. W 2003 roku Unesco przyjęło zalecenie dotyczące promowania wielojęzyczności w Internecie, jednak według badania przeprowadzonego w 2018 roku przez grupę kampanii Whose Knowledge ?, w Internecie znajduje się tylko około 7 procent języków świata.
Nawet Facebook obsługuje tylko nieco ponad 100 języków. To sprawia, że jest to najbardziej wielojęzyczna platforma mediów społecznościowych online, ale chce pójść dalej, aby utrzymać rozmowę przez bariery językowe. W październiku 2020 roku ogłosiła sztuczną inteligencję zdolną do tłumaczenia między dowolną parą 100 języków bez uprzedniego tłumaczenia na angielski, jak robi to wiele istniejących systemów - to kolejny krok od anglocentryczności architektury Internetu.
Tłumaczenie i polaryzacja
Tłumaczenie jest tym, co Vasco Pedro zna najlepiej. Portugalczyk z urodzenia, jest dyrektorem generalnym Unbabel, platformy tłumaczeniowej z siedzibą w Lizbonie i San Francisco, która łączy neuronowe tłumaczenie maszynowe z edycją przez ludzi, głównie dla działów obsługi klienta. Tak się składa, że ma również doktorat z technologii językowych.
„Trudno jest dokładnie określić, ale z grubsza rzecz biorąc, w 1998 roku około 85 procent wszystkich treści online stanowiło język angielski, w 2018 było to około 20 procent, a spodziewany jest spadek na poziomie około 10 procent”, mówi CGTN. „Ogólnie rzecz biorąc, mamy tendencję do tworzenia treści w naszym własnym języku, a obecnie za pośrednictwem sieci społecznościowych. Jeśli więc zbierzesz ilość treści, które ludzie tworzą każdego dnia w sieciach społecznościowych, po prostu zacznie ona przytłaczać wszystko inne”.
Pedro uznaje prymat języka angielskiego we współczesnych sieciach komunikacyjnych - „Z przyczyn organicznych i historycznych stworzył rusztowanie, na którym wszystko działa” - ale, podobnie jak Dorren, był świadkiem wzrostu liczby narzędzi nieanglojęzycznych, zarówno dla użytkowników, jak i za kulisami, które będą nadal wyrównywać szanse.
„Jeszcze trzy lata temu myślałem, że dominacja angielska będzie czymś trwałym” - wspomina, ale spotkanie z dużym chińskim sprzedawcą zmieniło jego zdanie. „Byłem w Chinach na spotkaniu i ktoś powiedział:„ Zdaliśmy sobie sprawę, że jednym z problemów, z jakimi borykają się nasi programiści, jest to, że ponieważ cała infrastruktura do kodowania jest w języku angielskim, muszą oni koniecznie rozumieć język angielski, aby móc pracować w systemach. Ale teraz zaczynamy rozwijać chińsko-centryczne narzędzia do produkcji chińsko-centrycznego oprogramowania ”.
Jeśli potrafisz skonsumować wszystko, czego potrzebujesz w swoim języku, masz mniejszą motywację do wychodzenia poza swój język i szukania wiedzy, której potrzebujesz
- Vasco Pedro
„Implikacje czegoś takiego są niewiarygodne, ponieważ kiedy już masz ten sam rodzaj stosów i architektur zbudowanych od podstaw w języku chińskim, prawdą będzie odwrotna sytuacja, w której każdy, kto chciałby ich używać, musiałby nauczyć się chińskiego Obecnie uważam, że w niektórych obszarach, takich jak wizja, a właściwie w wielu innych obszarach sztucznej inteligencji, istnieją istotne dowody na to, że Chiny przodują pod względem wyników badań, praktycznych zastosowań i rozpowszechniania. "
Ale każdy postęp ma swoją wadę i chociaż rosnąca dostępność większej liczby języków online jest bezsprzecznie dobrą rzeczą, Pedro obawia się potencjalnej wynikającej z tego segregacji i braku zapylenia krzyżowego.
„Tworzy ten mikrokosmos, w którym wszędzie jesteś narażony przede wszystkim na swój język. Dla kogoś takiego jak ja zazwyczaj istnieję w wielu różnych językach, ale globalizacja również powoduje podobne doświadczenia wszędzie, gdzie jesteś: różnorodność doświadczeń maleje, co oznacza, że przejście w inne miejsce jest mniej różne.
„Jest to związane z polaryzacją wiadomości i polaryzacją opinii: jeśli możesz konsumować wszystkie wiadomości, które możesz skonsumować z określonego punktu widzenia, prawdopodobnie nie będziesz chciał wyjść poza ten punkt widzenia. Jeśli możesz konsumuj wszystko, czego potrzebujesz w swoim języku, a będziesz mniej zmotywowany do wychodzenia poza swój język i szukania potrzebnej wiedzy ”.
Dialekty i idiomy
Ludzie spędzili tysiąclecia na próbach pokonywania barier językowych, ale tylko do pewnego stopnia. Jako poligloci, zarówno Pedro, jak i Dorren przyznają, że czasami używamy języka jako ochronnej peleryny.
„Istnieje nieodłączna potrzeba, aby ludzie wyróżniali się poprzez język” - mówi Pedro. „Język jest jednym z głównych wskaźników plemienia. Wyglądasz jak ja, więc jesteśmy podobni. Ale jeśli mówisz jak ja, możemy łatwo się połączyć. A jeśli mówisz moim językiem, to już jest pewne zaufanie. Jeśli mówisz mój język w sposób, w jaki robię, z moim akcentem, od razu pojawiają się pewne odniesienia kulturowe, które zakładam.
„Widzimy, że na przykład nastolatki mają tendencję do odkrywania języka na nowo, aby odróżnić się od poprzedniego pokolenia. Jest coś nieodłącznego w istotach ludzkich, mają tendencję do tworzenia języka i używania języka jako sposobu również stworzyć zróżnicowanie między grupami ”.
„Idiomy, język figuratywny, odniesienia kulturowe: te elementy naszego codziennego języka będą naprawdę trudnym orzechem do zgryzienia dla maszyn” - mówi Dorren. „To twardy orzech do zgryzienia dla ludzi - słyszę angielski od 40 lat i regularnie napotykam odniesienia kulturowe, których po prostu nie rozumiem, ponieważ nie jestem Brytyjczykiem. Potencjalnie bardzo zaawansowany komputer byłby lepiej - ale maszyna nie zawsze szuka humoru, podczas gdy wielu ludzi to robi. "
Nawet wśród osób posługujących się rzekomo tym samym językiem te drobne różnice rosną, a nie maleją. „Ludzie mówią po angielsku we współczesnej formie, powiedzmy 300 lat, 500 lat. Nie ma żadnej zbieżności w kierunku jednego angielskiego” - mówi Pedro. „Szkoci nie przestaną mówić tak, jak to robią, Irlandczycy, północna Anglia czy Amerykanie. Jeśli weźmiesz tylko brytyjską i amerykańską angielszczyznę, nie widzę, żeby to się zbliżyło”.
[Przejście na tłumaczenie maszynowe] zawsze przebiega wolniej, niż spodziewają się optymiści - jak autonomiczne pojazdy czy synteza jądrowa
- Gaston Dorren
To głównie używanie języka ustnego jest jednym z powodów, dla których Dorren rozróżnia potencjał przekładu „między pisemnym, które jest dosłownie tłumaczeniem, a ustnym, który wolałbym nazwać tłumaczeniem ustnym. W przypadku języka pisanego często jestem zdumiony jakością - a potem znowu jestem zdumiony gafami, jakie wywołuje to oprogramowanie ”.
Jeden przykład przytoczony na stronie internetowej Dorrena nie musiał nawet zostać przetłumaczony z angielskiego, aby został poważnie zniekształcony. Czytając książkę, zwrócił uwagę na cytat ze szkockiego filozofa-ekonomisty Adama Smitha, w którym wspomniał o „żebraku, który opala się na poboczu autostrady” - co jest mało prawdopodobne, biorąc pod uwagę, że Smith pisał w XVIII wieku.
Badania Dorrena wykazały, że pierwotny cytat kończył się słowem „autostrada” - ale brytyjski angielski wydawca zmienił go, przywracając wersję oryginalnej amerykańskiej książki angielskiej, w której się pojawił. Nie wiadomo, czy usterka była spowodowana przez człowieka, czy komputer, ale Dorren uważa, że dystans między tłumaczeniem maszynowym a ludzkim znika - stopniowo, ale nieuchronnie.
„Zawsze idzie wolniej, niż spodziewają się optymiści, podobnie jak na przykład pojazdy autonomiczne lub fuzja jądrowa” - mówi. „Kiedy widzę postęp w ciągu ostatnich 10 lat, spodziewam się, że stanie się to jak asymptota - czy to angielskie słowo? Jedna z tych krzywych, które pełzają w kierunku pionowej linii ... maszyna jest nie do odróżnienia od człowieka ”.
Nawet jeśli maszyna tłumacząca mogłaby kiedykolwiek przejść tę wersję testu Turinga, Dorren ostrzega, że wyniki mogą nie być natychmiastowe ze względu na różne struktury języków.
„Oprogramowanie musiałoby zaczekać do końca zdania, aby je przetłumaczyć” - ostrzega. „Wiele czasowników, które pojawiają się na końcu zdania niemieckiego, zaczyna się w zdaniu angielskim; gdybyś był tłumaczem maszynowym, musiałbyś poczekać do końca zdania niemieckiego, aby w ogóle rozpocząć tłumaczenie zdania angielskiego. "
W stronę prawdziwej ryby Babel
W 1978 roku autor komedii science-fiction Douglasa Adamsa Autostopem po galaktyce wyobraził sobie istnienie ryby Babel, która pochłaniała i wytwarzała fale dźwiękowe dokładnie tego rodzaju, aby działała jako natychmiastowy tłumacz dowolnego języka we wszechświecie.
Adams, jeden z pierwszych użytkowników technologii, w tym raczkujących komputerów Apple Macintosh, powiedział kiedyś: „Technologia to słowo opisujące coś, co jeszcze nie działa”. Ale od tego czasu postęp technologiczny sprawił, że możliwość tłumaczenia w czasie rzeczywistym wydaje się kusząco bliska - jeśli nie, przypuszczalnie oparta na rybach.
„Jeśli chodzi o posiadanie implantu w mózgu, który zaczyna zwiększać twoje możliwości metodami niebiologicznymi, myślę, że jesteśmy bardzo blisko” - mówi Pedro. „Miliony ludzi na świecie mają implant ślimakowy, który umożliwia im słyszenie w sposób, którego wcześniej nie mogli. Jesteśmy niedaleko od czasów, w których ktoś z implantem ślimakowym będzie słyszał o wiele lepiej niż ktoś bez niego, gdzie będą w stanie usłyszeć różne częstotliwości, a to będzie zaleta.
„Mając rybę Babel w tym sensie, że można coś powiedzieć i uchwycić to, co mówisz na piśmie, myślę, że nie jesteśmy tak daleko, ponieważ to kwestia hałasu. Rozpoznawanie mowy jest prostsze - jest trochę dźwięków i jest rzeczywista rzecz, którą powiedziałeś i to wszystko. "
Może nie będę już musiał uczyć się języka, ale będę chciał, bo to oznaka wiedzy
- Vasco Pedro
Ale możemy chcieć uważać, czego sobie życzymy - i to nie tylko dlatego, że Adams ostrzegł, że ryby Babel „skutecznie usuwając wszelkie bariery w komunikacji między różnymi rasami i kulturami, spowodowały więcej i bardziej krwawych wojen niż cokolwiek innego w historii stworzenia ”.
Bardziej realistycznie, jeśli natychmiastowe (i niezawodne) tłumaczenie stanie się możliwe, z pewnością mniej osób będzie się kłopotać nauką drugiego języka? Pedro przyznaje, że istnieje taka możliwość, ale wątpi, że nagle staniemy się światem monogotów.
„W perspektywie średnioterminowej, przez długi czas myślę, że nauczysz się języka swoich rodziców, swojego urodzenia, miejsca, w którym jesteś narażony” - mówi - „i jeśli nie dominuje angielski lub chiński, prawdopodobnie nauczysz się jeszcze jednego języka w szkole, ponieważ jest to dobre narzędzie: z perspektywy rozwoju mózgu dobrze jest uczyć się innych języków ”.
W przypadku Dorren zależy to od Twoich potrzeb. „Wiele osób zrezygnuje z nauki języków obcych, ponieważ zwrot z wysiłku będzie znacznie niższy” - mówi. „Jeśli prowadzisz teraz wypożyczalnię samochodów na jakiejś greckiej wyspie, musisz nauczyć się angielskiego, aby wykonywać swoją pracę. Jeśli potrafisz to robić z tłumaczeniem maszynowym, prawdopodobnie nie masz już do tego wystarczającej motywacji. nie robisz tego, żeby czytać Szekspira, robisz to, żeby wypożyczać samochody, prawda?
Pedro idzie w tym samym kierunku w przeciwnym kierunku. „Może nie będę już musiał uczyć się języka, ale będę chciał, bo to oznaka wiedzy” - podkreśla. „Nikt nie musi uczyć się gry na skrzypcach, nie ma już potrzeby uczyć się jeździć konno, ale wiele osób to robi, bo to fajne. Każdy program telefoniczny może pokonać najlepszego mistrza szachów ludzi, a jednak nigdy nie więcej ludzi uczy się grać w szachy, niż jest teraz ”.
Redaktorzy wideo: James Sandifer i Natalia Luz. Redaktor animacji: James Sandifer
Brak komentarzy:
Prześlij komentarz