przedruk - tłumaczenie przeglądarki
26 grudnia 2020 r
Czy technologia położy kres globalnej
dominacji języka angielskiego?
Gary Parkinson
Język to skomplikowana rzecz, często używana do prostych celów:
komunikowania się, ostrzegania, zabiegania o względy, handlu,
nauki. Jej rozwój może ukazać historię w miniaturze, ale
odcisnąć duże znaczenie na wydarzeniach na świecie.
Weźmy na przykład wyrażenie „lingua franca”. Oznacza
to, że każdy język używany przez tych, którzy nie mają
wspólnego języka, może być pidgin lub kreolskim korupcją lub
połączeniem dwóch języków, opracowanym między stronami z
wzajemną potrzebą zrozumienia - w handlu lub komunikacji.
Tak było w przypadku oryginalnego lingua franca - języka pidgin
lub kombinacji, którego używali w połowie ubiegłego tysiąclecia
kupcy i dyplomaci na całym wschodnim Morzu Śródziemnym. Oparta
na uproszczonych włoskich, ale zapożyczonych słowach z
portugalskiego, hiszpańskiego, francuskiego, greckiego, tureckiego i
arabskiego, ta pierwsza lingua franca została nazwana - być może
ironicznie, być może trafnie - imieniem Franków: ludów
germańskich, których imię było używane, przez ludy bizantyjskie
Imperium, reprezentujące wszystkich mieszkańców Europy Zachodniej.
Z drugiej strony, lingua franca może być językiem narzuconym z
góry, albo dobrowolnie, gdy pewna kultura dominuje przez
pierwszeństwo w okresie formacyjnym - na przykład standardowe
użycie włoskiego w operach i notacji muzycznej lub francuskiego w
balecie - lub mocniej w ramach wojskowej kampanii ujarzmienia i
kontroli.
To nałożenie wyjaśnia znaczenie angielskiego jako jednego z
najczęściej używanych języków na świecie. Imperium
brytyjskie zaczęło używać go na całym świecie, a nawet w fazie
post-imperialnej wiele byłych kolonii nadal używało go jako
podstawowego języka, często jako jednoczącej płaszczyzny wspólnej
ponad mnogością języków tubylczych. A gdy to imperium
upadło, inna kultura anglojęzyczna wyrosła na światowy prym.
„Niezależnie od tego, jak na to spojrzeć, angielski jest
dominującym językiem na świecie” - mówi Gaston Dorren CGTN
Europe - i powinien wiedzieć, jako autor lingwistyczny, który mówi
w sześciu językach, może czytać kolejnych dziewięć i napisał
książki w kilku z nich .
„To z powodu bardzo udanej przeszłości kolonialnej,
niezależnie od tego, jakie masz zdanie” - mówi. „Ale to
także z powodu bardzo dominującej kultury amerykańskiej, poprzez
Hollywood, z powodu amerykańskiej potęgi militarnej, potęgi
gospodarczej, II wojny światowej i tak dalej”.
Ponieważ komunikacja i transport skurczyły się na świecie,
język angielski stał się światowym lingua franca. Jak ujął
to Dorren: „W ostatnich dziesięcioleciach, kiedy amerykańska
dominacja gospodarcza, kulturowa, polityczna i militarna zbiegła się
z globalizacją, język angielski stał się językiem domyślnym
praktycznie we wszystkich dziedzinach globalnej komunikacji, od kina
i muzyki pop po naukę i lotnictwo cywilne”.
20 najlepszych języków świata według liczby użytkowników
Angielski 1,5 mld
Mandarynka 1,3 mld
Hiszpański 575m
Hindi-urdu 550m
Arabski 375m
Bengalski 275m
Portugalski 275m
Rosyjski 275m
Malajski 275m
Francuski 250m
Niemiecki 200m
Suahili 135m
Japoński 130m
Pendżabski 125m
Perski 110m
Jawajski 95m
Turecki 90m
Tamil 90m
Koreański 85m
Wietnamczyk 85m
Źródło: Babel , Gaston Dorren
Twój komputer mówi po angielsku
Mógł dodać technologię komputerową. Podczas gdy starsze
nauki ścisłe czerpią swoje słownictwo z tego, co Europejczycy
uważają za „klasyczne” języki łaciny i greki, informatyka -
dorastając w tym, co wielu nazywa „stuleciem amerykańskim” -
jest w dużej mierze oparta na języku angielskim… i dlatego też
architektura internetu.
W 2019 roku Gretchen McCulloch, lingwistka i
autorka bestsellerowego New York Timesa, ponieważ
Internet: rozumienie nowych reguł języka , odkryła, że
„oprogramowanie i platformy mediów społecznościowych są
obecnie często dostępne w około 30–100 językach”. Nie
brzmi to źle, dopóki nie zdasz sobie sprawy, że na planecie mówi
się i podpisuje w 6000 lub 7000 językach.
Ponadto McCulloch znalazł głębszy problem, który Karol Marks
mógłby nazwać środkami produkcji: „A co z narzędziami, które
czynią nas twórcami, a nie tylko konsumentami, narzędzi
obliczeniowych? Znalazłem cztery języki programowania, które są
szeroko dostępne w wielu językach wersje. Nie 400. Cztery (4). "
Podczas gdy same komputery są niezależne od języka, platformy,
na których działają, nie są, co stwarza barierę dla ogromnych
połaci świata. Jak zauważył McCulloch, „Nawet ogromne
języki, które mają rozległe tradycje literackie i są używane
jako regionalne języki handlowe, takie jak mandaryński, hiszpański,
hindi i arabski, nadal nie są szeroko rozpowszechnione jako języki
kodu”.
Jednak dzięki pionierom komputerów pracującym głównie w
Wielkiej Brytanii, a następnie w Stanach Zjednoczonych, język
angielski stał się niemal domyślnym lingua franca
informatyki. Chociaż może to ograniczać się do osób nie
mówiących po angielsku, które chcą karierę w programowaniu, może
to mieć wpływ na znacznie szerszą populację: w istocie każdy,
kto chce korzystać z komputera lub Internetu, musiał czekać na
„dostosowany” wersja pasująca do ich języka.
Nie zawsze było to tak szybkie, jak można się
spodziewać. Wczesne komputery były ograniczone przez ASCII
(American Standard Code for Information Interchange), oparty na
języku angielskim schemat kodowania znaków wprowadzony w 1963 roku
i ograniczony do 128 opcji.
„Angielski jest językiem ojczystym internetu” - mówi
Dorren. „Komputery pochodzą z Wielkiej Brytanii, potem
nowoczesne komputery pochodzą ze Stanów Zjednoczonych, a internet,
jak sądzę, powstał w Europie, z pewnością rozkwitł z Doliny
Krzemowej. Próbuję sobie wyobrazić, co by się stało, gdyby
internet zaczął się w Niemczech lub Francja - jestem pewien, że
widzielibyśmy inną trajektorię. "
Bardzo krótka historia technologii komunikacyjnej opartej na
języku angielskim
Taka anglocentryczność nie jest niczym nowym w technologii
rozpraszania języka. ASCII został opracowany z kodu
telegraficznego, który sam został potępiony za brak liter z
akcentami i innymi znakami diakrytycznymi - glify, które uzupełniają
litery alfabetu łacińskiego, takie jak cedilla (ç), tylda (ñ) lub
umlaut (ü). Są one prawie znikome w języku angielskim w
porównaniu z innymi językami używającymi alfabetu łacińskiego,
nie mówiąc już o innych zestawach liter lub znaków.
Podobnie układ maszyny do pisania QWERTY został stworzony w 1873
roku przez amerykańskiego redaktora gazety Christophera Lathama
Sholesa - chociaż pominął cyfry 0 i 1, licząc duże O i zamiast
tego mogłem wykonywać te prace. Bardziej trafnie na większości
planety projekt nie uwzględniał akcentów, znaków diakrytycznych i
innych zestawów znaków.
Ci, którzy używali różnych alfabetów, musieli albo wymyślić
własny sprzęt (taki jak nowe układy klawiatury) lub zestawy znaków
(takie jak przyjazna dla umlautów wersja amerykańskiego Samuela
Morse'a, zatytułowana, ale pozbawiona znaków diakrytycznych) lub po
prostu zgodzić się do zanglicyzowanych alternatyw.
Chociaż świat się zglobalizował, sytuacja ta nie uległa
poprawie w czasie. Podczas gdy wynalazcy nieanglojęzyczni mogli
budować własne maszyny do pisania, a szerszy kod Gerke wkrótce
zastąpił alfabet Morse'a, ASCII pozostał standardem w sieci do
2008 roku - dlatego nazwy domen przed ostatnią dekadą były
ograniczone do znaków angielskich.
To pierwszy przypadek, gdy jeden język jest lingua franca na
całym świecie. Jest wiele dziedzin, na których możemy o tym
tylko pomarzyć
- Gaston Dorren
„Istnieje różnica między obecnym statusem języka
angielskiego a statusem wszystkich innych lingua francas, które
miały miejsce wcześniej: po raz pierwszy jeden język jest lingua
franca na całym świecie” - mówi Dorren. Uważa, że pod
pewnymi względami nie jest to zła rzecz - a na pewno nie tak
destrukcyjna, jak idea, by jakikolwiek inny język stał się tak
dominujący.
„Jest wiele dziedzin, w których możemy o tym tylko pomarzyć.
Wystarczy pomyśleć o gniazdkach: podróżujesz za granicę i
potrzebujesz różnego rodzaju adapterów do podłączenia komputera.
Gdybyśmy mieli jeden typ gniazdka, a potem ktoś powiedziałby:„
Nie, wiesz co, teraz jestem dominujący, chcę to zmienić, „nie
dostosowywalibyśmy się, nie robilibyśmy tego. Myślę, że to samo
dotyczy języka”.
Alfabety i inne dane wejściowe
Język może wiele zdziałać z odpowiednią pomocą. Imperium
rzymskie rozpowszechniło alfabet łaciński w dużej części
Europy; sam język łaciński stał się podstawą języka
włoskiego, francuskiego, hiszpańskiego, portugalskiego i
rumuńskiego, z dalszym wpływem na język niderlandzki, norweski,
duński, szwedzki, a zwłaszcza angielski.
Z kolei te bardziej nowoczesne języki europejskie - i wspólny
alfabet - rozprzestrzeniły się na całym świecie w drugiej połowie
ubiegłego tysiąclecia, do tego stopnia, że alfabet łaciński
jest obecnie używany przez około 70 procent światowej populacji.
Ekspansja kulturowa nadal odbywa się teraz poprzez zapożyczenia,
które przybywają do jednego języka z innego bez tłumaczenia
(przetłumaczone słowa lub wyrażenia nazywane są kalkami),
reprezentując w ten sposób małą placówkę językową w obcym
języku.
Nie zawsze są mile widziani; Academie Française długo i
ciężko walczyła przeciwko pełzającej anglicyzacji języka
francuskiego - jeśli nie zawsze z sukcesem. Dominacja kultury
prowadzonej przez Stany Zjednoczone - w rozrywkowych kanałach
muzycznych, filmach i telewizji, ale także w świecie komercyjnym o
coraz większej marce - doprowadziła do ciągłego „kulturowego
pełzania”.
Niecałe sto lat temu turecki (obecnie używany przez 90 milionów)
przeszedł od pisma perskiego / arabskiego do niestandardowej wersji
alfabetu łacińskiego, zmieniając wiele słów w słowniku. Ten
niezrównany akt rewolucji leksykalnej jednocześnie ponownie wyraził
dumne dziedzictwo Turcji - wiele starych zapożyczeń zostało
porzuconych, albo dla synonimów regionalnych dialektów, albo po
prostu dla neologizmów opartych na tureckich korzeniach -
jednocześnie zmieniając spojrzenie kulturowe kraju ze wschodu na
zachód.
Mimo to około 30 procent świata nie używa alfabetu
łacińskiego. Książka Gastona Dorrena Babel bada
każdy z 20 najpopularniejszych języków świata, z których
dokładnie połowa korzysta ze skryptów innych niż łaciński:
koreański (używany przez 85 milionów), tamilski (90 milionów),
perski (110 milionów), pendżabski (125 milionów), Japoński (130
milionów), rosyjski (275 milionów), bengalski (275 milionów),
arabski (375 milionów), hindi / urdu (550 milionów) i mandaryński
(1,3 miliarda).
W przypadku tych ogromnych obszarów planety domyślne łacińskie
ABC w Internecie nie ma znaczenia. Coraz popularniejszym
produktem ubocznym tego podziału jest pinyin - „zratynizowany”
system przedstawiania chińskich znaków. Chociaż pierwotnie
opracowany przez chińskich lingwistów w latach pięćdziesiątych
XX wieku, pinyin (dosłownie „dźwięk zaklęcia”) został
wzmocniony przez najnowsze postępy technologiczne, w których
priorytetem jest alfabet łaciński.
Ale czy nie jest to kolejny przykład kulturowego pełzania,
anglofońskiej dominacji ukradkiem? Nie dla Dorrena, który
wątpi w zdolność świata do nauki chińskiego, ale z zadowoleniem
przyjmuje wszelkie pomosty między użytkownikami różnych języków.
Mogę sobie wyobrazić informacje online w języku chińskim
automatycznie przepisywane na pinyin - tak jak serbskie strony
internetowe automatycznie dokonują transliteracji między łaciną a
cyrylicą
- Gaston Dorren
„Pinyin to zdecydowanie dobra rzecz z wielu powodów” -
mówi. „Jeśli mandaryński odniesie większy sukces na arenie
międzynarodowej, niż się szczerze spodziewam, pinyin byłby
doskonałym interfejsem. Mogę sobie wyobrazić, że informacje
online w języku chińskim będą automatycznie przepisywane na
pinyin - podobnie jak serbskie witryny internetowe automatycznie
dokonują transliteracji między łaciną a cyrylicą, co robią
nienagannie.
„Byłoby to możliwe w przypadku pinyin, ponieważ system działa
w taki sposób, że nie byłby zbyt skomplikowany. Komputer nie ma
problemu z zapamiętaniem 6000 lub 10 000, a nawet niesławnych 50
000 znaków [w języku chińskim mandaryńskim]. Komputer może to
zrobić : tylko my, biedni, mokrzy ludzie, nie dajemy rady ”.
Jednak my, biedni, mokrzy ludzie, możemy zarządzać naszymi
ręcznymi komputerami, korzystając z innej powstającej technologii,
która jest całkowicie wolna od klawiatury: wprowadzanie
głosu. Badania sugerują, że około połowa wszystkich
wyszukiwań odbywa się teraz za pomocą poleceń głosowych, do
czego przyczyniła się popularność asystentów głosowych, takich
jak Echo, Alexa i Siri.
Korzystając z technologicznego koktajlu uczenia maszynowego i
przetwarzania języka naturalnego (NLP), technologie te automatycznie
określają język mówiony - lub języki, bez wysiłku przełączając
się z jednego na drugi, co jest tak często konieczne, biorąc pod
uwagę, że tylko 40 procent świata jest jednojęzyczne.
Domeny i języki
W międzyczasie architektura internetu z opóźnieniem otwiera się
na znaki spoza alfabetu łacińskiego. „Ludzie, którzy
używają różnych alfabetów - cyrylicy, koreańskiego lub
mandaryńskiego, chińskich znaków, indyjskich pism - dziś wszyscy
mogą używać tych alfabetów na swoich komputerach, smartfonach i
tabletach” - mówi Dorren.
„Rozmawiałem z facetem z Google, którego zespół bardzo
ciężko pracował, tworząc dziesiątki indyjskich skryptów, aby
tablety, komputery i smartfony były dostępne dla ludzi i aby nie
musieli pisać po angielsku lub być może w hindi. Monopol został z
pewnością złamany i Twoje i moje wrażenie, że to wszystko po
łacinie w Internecie, może być trochę zaściankowe, ponieważ tam
się wybieramy.
Rzeczywiście, Indie - ogromny rynek z być może oszałamiającym
wachlarzem języków liczącym tysiące - znalazły się w czołówce,
jeśli chodzi o zakończenie upartego uprzedzenia w kierunku alfabetu
łacińskiego w ogóle, a zwłaszcza języka angielskiego.
W listopadzie 2019 r.Med Manish Maheshwari z Twitter India z dumą
ogłosił, że jego szybko rozwijająca się platforma jest teraz
mniej niż w połowie angielska, po dodaniu opcji preferowanego
języka, aby pomóc algorytmom w wyświetlaniu treści specyficznych
dla użytkownika.
„Czuliśmy, że rozwiązywanie problemów językowych w Indiach
będzie bardzo ważne” - powiedział Maheshwari. „Już teraz
tweety w języku innym niż angielski stanowią 50 procent wszystkich
tweetów. Widzieliśmy to w ciągu ostatnich sześciu do ośmiu
miesięcy z powodu zmian, jakie wprowadziliśmy w produkcie”. Twitter
India współpracował również z 70 partnerami medialnymi przy
przyswajaniu lokalnych treści i rozpoczynaniu rozmów.
W 1998 roku około 85% treści online stanowiło język angielski,
w 2018 było to około 20%. Oczekuje się, że osiągnie około
10%
- Vasco Pedro, CEO platformy tłumaczeniowej Unbabel
W międzyczasie od 2010 roku projekt Internationalized Domain
Names (IDN) uwolnił Internet od jego pęt ASCII i udostępnił 152
domeny najwyższego poziomu (bit po kropce, jak .com lub .net), w tym
75 w skryptach chińskim, japońskim lub koreańskim. plus 33 w
alfabecie arabskim. Obecnie istnieje ponad dziewięć milionów
zarejestrowanych domen IDN, co stanowi około jedną na 40 całkowitej
liczby domen na świecie - i szybko rośnie.
Badanie przeprowadzone przez Radę Europejskich Krajowych
Rejestrów Domen najwyższego poziomu i Oxford Information Labs
sugeruje, że takie dostosowane domeny „zwiększają obecność
lokalnych języków w Internecie i wykazują niższy poziom
znajomości języka angielskiego niż w sektorze nazw domen na całym
świecie”.
Ten impuls może uratować te spośród około 6000 języków
świata, którym dominacja języka angielskiego może grozić
wyginięciem. W 2003 roku Unesco przyjęło zalecenie dotyczące
promowania wielojęzyczności w Internecie, jednak według badania
przeprowadzonego w 2018 roku przez grupę kampanii Whose Knowledge ?,
w Internecie znajduje się tylko około 7 procent języków świata.
Nawet Facebook obsługuje tylko nieco ponad 100 języków. To
sprawia, że jest to najbardziej wielojęzyczna platforma
mediów społecznościowych online, ale chce pójść dalej, aby
utrzymać rozmowę przez bariery językowe. W październiku 2020
roku ogłosiła sztuczną inteligencję zdolną do tłumaczenia
między dowolną parą 100 języków bez uprzedniego tłumaczenia na
angielski, jak robi to wiele istniejących systemów - to kolejny
krok od anglocentryczności architektury Internetu.
Tłumaczenie i polaryzacja
Tłumaczenie jest tym, co Vasco Pedro zna najlepiej. Portugalczyk
z urodzenia, jest dyrektorem generalnym Unbabel, platformy
tłumaczeniowej z siedzibą w Lizbonie i San Francisco, która łączy
neuronowe tłumaczenie maszynowe z edycją przez ludzi, głównie dla
działów obsługi klienta. Tak się składa, że ma
również doktorat z technologii językowych.
„Trudno jest dokładnie określić, ale z grubsza rzecz biorąc,
w 1998 roku około 85 procent wszystkich treści online stanowiło
język angielski, w 2018 było to około 20 procent, a spodziewany
jest spadek na poziomie około 10 procent”, mówi CGTN. „Ogólnie
rzecz biorąc, mamy tendencję do tworzenia treści w naszym własnym
języku, a obecnie za pośrednictwem sieci społecznościowych. Jeśli
więc zbierzesz ilość treści, które ludzie tworzą każdego dnia
w sieciach społecznościowych, po prostu zacznie ona przytłaczać
wszystko inne”.
Pedro uznaje prymat języka angielskiego we współczesnych
sieciach komunikacyjnych - „Z przyczyn organicznych i historycznych
stworzył rusztowanie, na którym wszystko działa” - ale, podobnie
jak Dorren, był świadkiem wzrostu liczby narzędzi
nieanglojęzycznych, zarówno dla użytkowników, jak i za kulisami,
które będą nadal wyrównywać szanse.
„Jeszcze trzy lata temu myślałem, że dominacja angielska
będzie czymś trwałym” - wspomina, ale spotkanie z dużym
chińskim sprzedawcą zmieniło jego zdanie. „Byłem w Chinach
na spotkaniu i ktoś powiedział:„ Zdaliśmy sobie sprawę, że
jednym z problemów, z jakimi borykają się nasi programiści, jest
to, że ponieważ cała infrastruktura do kodowania jest w języku
angielskim, muszą oni koniecznie rozumieć język angielski, aby móc
pracować w systemach. Ale teraz zaczynamy rozwijać
chińsko-centryczne narzędzia do produkcji chińsko-centrycznego
oprogramowania ”.
Jeśli potrafisz skonsumować wszystko, czego potrzebujesz w swoim
języku, masz mniejszą motywację do wychodzenia poza swój język i
szukania wiedzy, której potrzebujesz
- Vasco Pedro
„Implikacje czegoś takiego są niewiarygodne, ponieważ kiedy
już masz ten sam rodzaj stosów i architektur zbudowanych od podstaw
w języku chińskim, prawdą będzie odwrotna sytuacja, w której
każdy, kto chciałby ich używać, musiałby nauczyć się
chińskiego Obecnie uważam, że w niektórych obszarach, takich jak
wizja, a właściwie w wielu innych obszarach sztucznej inteligencji,
istnieją istotne dowody na to, że Chiny przodują pod względem
wyników badań, praktycznych zastosowań i rozpowszechniania. "
Ale każdy postęp ma swoją wadę i chociaż rosnąca dostępność
większej liczby języków online jest bezsprzecznie dobrą rzeczą,
Pedro obawia się potencjalnej wynikającej z tego segregacji i braku
zapylenia krzyżowego.
„Tworzy ten mikrokosmos, w którym wszędzie jesteś narażony
przede wszystkim na swój język. Dla kogoś takiego jak ja zazwyczaj
istnieję w wielu różnych językach, ale globalizacja również
powoduje podobne doświadczenia wszędzie, gdzie jesteś:
różnorodność doświadczeń maleje, co oznacza, że przejście
w inne miejsce jest mniej różne.
„Jest to związane z polaryzacją wiadomości i polaryzacją
opinii: jeśli możesz konsumować wszystkie wiadomości, które
możesz skonsumować z określonego punktu widzenia, prawdopodobnie
nie będziesz chciał wyjść poza ten punkt widzenia. Jeśli możesz
konsumuj wszystko, czego potrzebujesz w swoim języku, a będziesz
mniej zmotywowany do wychodzenia poza swój język i szukania
potrzebnej wiedzy ”.
Dialekty i idiomy
Ludzie spędzili tysiąclecia na próbach pokonywania barier
językowych, ale tylko do pewnego stopnia. Jako poligloci,
zarówno Pedro, jak i Dorren przyznają, że czasami używamy języka
jako ochronnej peleryny.
„Istnieje nieodłączna potrzeba, aby ludzie wyróżniali się
poprzez język” - mówi Pedro. „Język jest jednym z
głównych wskaźników plemienia. Wyglądasz jak ja, więc jesteśmy
podobni. Ale jeśli mówisz jak ja, możemy łatwo się połączyć.
A jeśli mówisz moim językiem, to już jest pewne zaufanie. Jeśli
mówisz mój język w sposób, w jaki robię, z moim akcentem, od
razu pojawiają się pewne odniesienia kulturowe, które zakładam.
„Widzimy, że na przykład nastolatki mają tendencję do
odkrywania języka na nowo, aby odróżnić się od poprzedniego
pokolenia. Jest coś nieodłącznego w istotach ludzkich, mają
tendencję do tworzenia języka i używania języka jako sposobu
również stworzyć zróżnicowanie między grupami ”.
„Idiomy, język figuratywny, odniesienia kulturowe: te elementy
naszego codziennego języka będą naprawdę trudnym orzechem do
zgryzienia dla maszyn” - mówi Dorren. „To twardy orzech do
zgryzienia dla ludzi - słyszę angielski od 40 lat i regularnie
napotykam odniesienia kulturowe, których po prostu nie rozumiem,
ponieważ nie jestem Brytyjczykiem. Potencjalnie bardzo zaawansowany
komputer byłby lepiej - ale maszyna nie zawsze szuka humoru, podczas
gdy wielu ludzi to robi. "
Nawet wśród osób posługujących się rzekomo tym samym
językiem te drobne różnice rosną, a nie maleją. „Ludzie
mówią po angielsku we współczesnej formie, powiedzmy 300 lat, 500
lat. Nie ma żadnej zbieżności w kierunku jednego angielskiego” -
mówi Pedro. „Szkoci nie przestaną mówić tak, jak to robią,
Irlandczycy, północna Anglia czy Amerykanie. Jeśli weźmiesz tylko
brytyjską i amerykańską angielszczyznę, nie widzę, żeby to się
zbliżyło”.
[Przejście na tłumaczenie maszynowe] zawsze przebiega wolniej,
niż spodziewają się optymiści - jak autonomiczne pojazdy czy
synteza jądrowa
- Gaston Dorren
To głównie używanie języka ustnego jest jednym z powodów, dla
których Dorren rozróżnia potencjał przekładu „między
pisemnym, które jest dosłownie tłumaczeniem, a ustnym, który
wolałbym nazwać tłumaczeniem ustnym. W przypadku języka pisanego
często jestem zdumiony jakością - a potem znowu jestem zdumiony
gafami, jakie wywołuje to oprogramowanie ”.
Jeden przykład przytoczony na stronie internetowej
Dorrena nie musiał nawet zostać przetłumaczony z
angielskiego, aby został poważnie zniekształcony. Czytając
książkę, zwrócił uwagę na cytat ze szkockiego
filozofa-ekonomisty Adama Smitha, w którym wspomniał o „żebraku,
który opala się na poboczu autostrady” - co jest mało
prawdopodobne, biorąc pod uwagę, że Smith pisał w XVIII wieku.
Badania Dorrena wykazały, że pierwotny cytat kończył się
słowem „autostrada” - ale brytyjski angielski wydawca zmienił
go, przywracając wersję oryginalnej amerykańskiej książki
angielskiej, w której się pojawił. Nie wiadomo, czy usterka
była spowodowana przez człowieka, czy komputer, ale Dorren uważa,
że dystans między tłumaczeniem maszynowym a ludzkim znika -
stopniowo, ale nieuchronnie.
„Zawsze idzie wolniej, niż spodziewają się optymiści,
podobnie jak na przykład pojazdy autonomiczne lub fuzja jądrowa”
- mówi. „Kiedy widzę postęp w ciągu ostatnich 10 lat,
spodziewam się, że stanie się to jak asymptota - czy to angielskie
słowo? Jedna z tych krzywych, które pełzają w kierunku pionowej
linii ... maszyna jest nie do odróżnienia od człowieka ”.
Nawet jeśli maszyna tłumacząca mogłaby kiedykolwiek przejść
tę wersję testu Turinga, Dorren ostrzega, że wyniki mogą
nie być natychmiastowe ze względu na różne struktury języków.
„Oprogramowanie musiałoby zaczekać do końca zdania, aby je
przetłumaczyć” - ostrzega. „Wiele czasowników, które
pojawiają się na końcu zdania niemieckiego, zaczyna się w zdaniu
angielskim; gdybyś był tłumaczem maszynowym, musiałbyś poczekać
do końca zdania niemieckiego, aby w ogóle rozpocząć tłumaczenie
zdania angielskiego. "
W stronę prawdziwej ryby Babel
W 1978 roku autor komedii science-fiction Douglasa
Adamsa Autostopem po galaktyce wyobraził sobie istnienie
ryby Babel, która pochłaniała i wytwarzała fale dźwiękowe
dokładnie tego rodzaju, aby działała jako natychmiastowy tłumacz
dowolnego języka we wszechświecie.
Adams, jeden z pierwszych użytkowników technologii, w tym
raczkujących komputerów Apple Macintosh, powiedział kiedyś:
„Technologia to słowo opisujące coś, co jeszcze nie działa”. Ale
od tego czasu postęp technologiczny sprawił, że możliwość
tłumaczenia w czasie rzeczywistym wydaje się kusząco bliska -
jeśli nie, przypuszczalnie oparta na rybach.
„Jeśli chodzi o posiadanie implantu w mózgu, który zaczyna
zwiększać twoje możliwości metodami niebiologicznymi, myślę, że
jesteśmy bardzo blisko” - mówi Pedro. „Miliony ludzi na
świecie mają implant ślimakowy, który umożliwia im słyszenie w
sposób, którego wcześniej nie mogli. Jesteśmy niedaleko od
czasów, w których ktoś z implantem ślimakowym będzie słyszał o
wiele lepiej niż ktoś bez niego, gdzie będą w stanie usłyszeć
różne częstotliwości, a to będzie zaleta.
„Mając rybę Babel w tym sensie, że można coś powiedzieć i
uchwycić to, co mówisz na piśmie, myślę, że nie jesteśmy tak
daleko, ponieważ to kwestia hałasu. Rozpoznawanie mowy jest
prostsze - jest trochę dźwięków i jest rzeczywista rzecz, którą
powiedziałeś i to wszystko. "
Może nie będę już musiał uczyć się języka, ale będę
chciał, bo to oznaka wiedzy
- Vasco Pedro
Ale możemy chcieć uważać, czego sobie życzymy - i to nie
tylko dlatego, że Adams ostrzegł, że ryby Babel „skutecznie
usuwając wszelkie bariery w komunikacji między różnymi rasami i
kulturami, spowodowały więcej i bardziej krwawych wojen niż
cokolwiek innego w historii stworzenia ”.
Bardziej realistycznie, jeśli natychmiastowe (i niezawodne)
tłumaczenie stanie się możliwe, z pewnością mniej osób będzie
się kłopotać nauką drugiego języka? Pedro przyznaje, że
istnieje taka możliwość, ale wątpi, że nagle staniemy się
światem monogotów.
„W perspektywie średnioterminowej, przez długi czas myślę,
że nauczysz się języka swoich rodziców, swojego urodzenia,
miejsca, w którym jesteś narażony” - mówi - „i jeśli nie
dominuje angielski lub chiński, prawdopodobnie nauczysz się jeszcze
jednego języka w szkole, ponieważ jest to dobre narzędzie: z
perspektywy rozwoju mózgu dobrze jest uczyć się innych języków
”.
W przypadku Dorren zależy to od Twoich potrzeb. „Wiele
osób zrezygnuje z nauki języków obcych, ponieważ zwrot z wysiłku
będzie znacznie niższy” - mówi. „Jeśli prowadzisz teraz
wypożyczalnię samochodów na jakiejś greckiej wyspie, musisz
nauczyć się angielskiego, aby wykonywać swoją pracę. Jeśli
potrafisz to robić z tłumaczeniem maszynowym, prawdopodobnie nie
masz już do tego wystarczającej motywacji. nie robisz tego, żeby
czytać Szekspira, robisz to, żeby wypożyczać samochody, prawda?
Pedro idzie w tym samym kierunku w przeciwnym kierunku. „Może
nie będę już musiał uczyć się języka, ale będę chciał, bo
to oznaka wiedzy” - podkreśla. „Nikt nie musi uczyć się
gry na skrzypcach, nie ma już potrzeby uczyć się jeździć konno,
ale wiele osób to robi, bo to fajne. Każdy program telefoniczny
może pokonać najlepszego mistrza szachów ludzi, a jednak nigdy nie
więcej ludzi uczy się grać w szachy, niż jest teraz ”.
Redaktorzy wideo: James Sandifer i Natalia Luz. Redaktor
animacji: James Sandifer
https://newseu.cgtn.com/news/2020-12-26/Will-technology-end-the-English-language-s-global-domination--WfQn5ByAKI/index.html