Sztuczna Inteligencja potrafi dekodować mowę ludzką z aktywności mózgu 

Sztuczna Inteligencja potrafi dekodować mowę ludzką z aktywności mózgu 

Naukowcy zajmujący się sztuczną inteligencją znaleźli sposób, by dekodować mowę ludzką z aktywności mózgu. Umożliwi to w przyszłości komunikację z osobami w stanach wegetatywnych. 

.Naukowcy zdołali opracować sztuczną inteligencję, która jest zdolna dekodować mowę ludzką poprzez śledzenie aktywności mózgu. Dokonali tego badacze z Mety, firmy macierzystej Facebooka. Jak informuje Science News, technologia w przyszłości pozwoli komunikować się osobom w stanach wegetatywnych.

Sztuczna Inteligencja jest zdolna dekodować słowa i zdania z aktywności mózgu z zaskakującą dokładnością.  Nie jest jeszcze w stanie pomóc osobom niemogącym się komunikować, ale obecnie działa już zaskakująco dużą dokładnością. Wykorzystując dane dotyczące aktywności mózgu – zebrane w zaledwie kilka sekund – SI zgaduje, co dana osoba usłyszała. Naukowcy odkryli, że odpowiedź, której chce udzielić użytkownik technologii, znajduje się w pierwszych 10 propozycjach odpowiedzi podanych przez sztuczną inteligencję. Tak było w 73 procentach przypadków.

Wydajność sztucznej inteligencji przewyższała to, co wiele osób uważało za możliwe na tym etapie – powiedział Giovanni Di Liberto, informatyk z Trinity College w Dublinie. 

Sztuczna Inteligencja, opracowana w Mecie, może w przyszłości zostać wykorzystana do pomocy tysiącom ludzi na całym świecie, którzy nie są w stanie komunikować się za pomocą mowy, gestów lub użycia klawiatury. Obejmuje to wielu pacjentów minimalnie przytomnych, zamkniętych lub w stanach wegetatywnych. 

Jak działa nowa technologia?

.Większość istniejących już technologii, aby pomóc takim pacjentom w komunikacji, wymaga ryzykownych operacji mózgu w celu wszczepienia elektrod. Zdaniem neurobiologa Jean-Rémiego King’a, badacza Meta AI, nowe podejście mogłoby zapewnić realną ścieżkę pomocy pacjentom z deficytami komunikacyjnymi bez stosowania inwazyjnych metod.  

Jean-Rémie King wraz ze współpracownikami wyszkolił narzędzie obliczeniowe do wykrywania słów i zdań na 56 tysiącach godzin nagrań mowy. Narzędzie to, znane również jako “Model Językowy”, nauczyło się rozpoznawać specyficzne cechy języka zarówno na poziomie liter i sylab oraz na poziomie słów i zdań. 

Zespół zastosował SI z “Modelem Językowym” do baz danych z czterech instytucji, które zawierały aktywność mózgu 169 ochotników. W bazach danych zawarte były nagrania mózgów ochotników ze skanowania za pomocą magnetoencefalografii lub elektroencefalografii w czasie, gdy słuchali różnych historii i zdań, na przykład z książki Ernesta Hemingwaya pt. “Stary człowiek i morze” lub dzieła Lewisa Carrolla pt. “Przygody Alicji w Krainie Czarów”. Techniki te mierzą magnetyczny lub elektryczny składnik sygnałów mózgowych. 

Następnie z pomocą metody obliczeniowej, która pomaga uwzględnić fizyczne różnice między rzeczywistymi mózgami, zespół próbował zdekodować, co uczestnicy usłyszeli, używając tylko trzech sekund danych o aktywności mózgu każdej osoby. Zespół polecił sztucznej inteligencji dopasować dźwięki mowy z nagrań historii do wzorców aktywności mózgu, które obliczyła jako odpowiadające temu, co ludzie słyszeli. Następnie, biorąc pod uwagę ponad 1000 możliwości, przewidywała, co dana osoba mogła usłyszeć w tym czasie. 

Naukowcy odkryli, że przy użyciu magnetoencefalografii (MEG) poprawna odpowiedź znajdowała się w pierwszej dziesiątce przypuszczeń sztucznej inteligencji aż w 73 procentach przypadków. W przypadku elektroencefalografii wartość ta spadła do około 30 procent. Wydajność MEG jest bardzo dobra, ale nie jest ona praktyczna w zastosowaniu. Powodem jest to, że MEG wymaga nieporęcznej i drogiej maszyny. Wprowadzenie tej technologii w klinikach będzie wymagało innowacji naukowych, które sprawią, że maszyny będą tańsze i łatwiejsze w użyciu.

 Przyszłość odkrycia

.Ważne jest, aby zrozumieć, co “dekodowanie” naprawdę oznacza w tym badaniu. Słowo to jest często używane do opisania procesu odszyfrowywania informacji bezpośrednio ze źródła, w tym przypadku mowy z aktywności mózgu. Ale SI mogła to zrobić tylko dlatego, że dostarczono jej skończoną listę możliwych poprawnych odpowiedzi, aby mogła snuć swoje domysły. 

.Sztuczna Inteligencja dekodowała informacje uczestników pasywnie słuchających nagrań, co nie opisywało dokładnie tego co chcieli powiedzieć pacjenci. Aby stała się ona znaczącym narzędziem komunikacji, naukowcy będą musieli nauczyć się odszyfrowywać z aktywności mózgu to, co pacjenci zamierzają powiedzieć. Jest to dopiero początek, ale w przyszłości pozwoli to ludziom, niezdolnym do tego z różnych powodów, komunikować się.  

Oprac. Emil Gołoś

Materiał chroniony prawem autorskim. Dalsze rozpowszechnianie wyłącznie za zgodą wydawcy. 29 października 2022