Język z wyspy Man przetrwa dzięki sztucznej inteligencji

Cyfrowy głos z wyspy Man pozwoli zachować bujną różnorodność języków na naszej planecie, chroniąc zagrożone dialekty i utrwalając ich brzmienie dla przyszłych pokoleń.
.Język manx, tradycyjnie związany z Wyspą Man, która jest zależną wyspą od korony brytyjskiej należy dziś do grona języków zagrożonych, a według spisu z 2021 roku posługuje się nim około 2200 osób. To niewielka liczba, szczególnie jeśli zestawić ją z dominacją języka angielskiego w regionie, który w dzisiejszych czasach jest drugim językiem, którym osoby go znające się posługują.
Właśnie dlatego tak duże znaczenie mają projekty, które próbują przenieść język manx do współczesnych technologii. Jednym z nich jest inicjatywa Chrisa Bartleya, doktoranta informatyki na University of Sheffield, pochodzącego z Wyspy Man, który opracowuje rozwiązania AI text-to-speech i rozpoznawania mowy dla języków zagrożonych. W praktyce oznacza to, że sztuczna inteligencja może po raz pierwszy „mówić” po manx, co jeszcze niedawno wydawało się poza zasięgiem ze względu na bardzo ograniczoną ilość danych treningowych.
Największym problemem przy tworzeniu narzędzi głosowych dla małych języków jest właśnie brak materiału. Wielkie modele językowe i systemy syntezy mowy zwykle rozwija się dla języków, które mają ogromne zasoby nagrań, tekstów i słowników cyfrowych. W przypadku manx sytuacja jest odwrotna: zasoby istnieją, ale są rozproszone i znacznie skromniejsze niż dla angielskiego, hiszpańskiego czy mandaryńskiego.
Bartley postawił więc nie na prosty model oparty na dużym zbiorze danych, lecz na bardziej oszczędne, inteligentne podejście do ich wykorzystania. W ramach projektu przez wiele miesięcy zbierał i dokumentował dostępne materiały z takich źródeł jak YouTube, Manx Radio i platforma Learn Manx. W rezultacie udało się zgromadzić około 350 godzin nagrań mowy oraz 8 milionów słów w języku manx. To właśnie ta baza stała się fundamentem dla budowy cyfrowego głosu i systemu automatycznego rozpoznawania mowy.
Znaczenie tego typu rozwiązań wykracza daleko poza samą ciekawostkę technologiczną. System text-to-speech może pomóc nauczycielom i uczniom, bo ułatwia tworzenie materiałów do nauki, nagrań wymowy i ćwiczeń słuchowych bez konieczności angażowania za każdym razem ograniczonej liczby rodzimych użytkowników języka. Ma to także wymiar dostępnościowy: technologia syntezy mowy może wspierać czytniki ekranu dla osób z niepełnosprawnością wzroku, a w przyszłości również inne narzędzia asystujące. W przypadku małych społeczności językowych to szczególnie ważne, bo brak nowoczesnych rozwiązań cyfrowych często przyspiesza marginalizację języka. Jeśli dany język nie funkcjonuje w smartfonie, komputerze, aplikacji edukacyjnej czy systemie odczytu treści, młodsze pokolenia zaczynają od niego odchodzić, ponieważ nie jest praktyczny. Cyfrowy głos języka manx może więc pomóc nie tylko w zachowaniu dziedzictwa, ale też w przywróceniu mu realnej obecności w codziennym, nowoczesnym świecie.
Projekt Bartleya przyniósł już również system automatycznego rozpoznawania mowy dla manx, a w planach jest publiczne udostępnienie narzędzia społeczności oraz rozwój kolejnych modeli, być może także tłumaczeniowych. To ważny sygnał, że ochrona języków zagrożonych nie musi ograniczać się do archiwizacji starych nagrań czy publikowania słowników.
.Jeżeli w tych czasach mamy już takie możliwości, które pozwalają nam zachowywać naszą różnorodność kulturową i przenosić ją również do świata cyfrowego, nawet jeżeli na co dzień mają nie być masowo wykorzystywane to powinniśmy iść w tym kierunku.
Szymon Ślubowski




