Robot, który potrafi nauczyć się mówić i spiewać [Science Robotics]

Naukowcy stworzyli robota, który potrafi nauczyć się ruchów warg potrzebnych do mowy i śpiewu. Maszyna uczy się tego sama – z obserwacji własnego odbicia w lustrze oraz z obserwacji ludzi. Robot zaśpiewał już piosenkę ze swojego debiutanckiego albumu - wygenerowanego przez sztuczną inteligencję.

Naukowcy stworzyli robota, który potrafi nauczyć się ruchów warg potrzebnych do mowy i śpiewu. Maszyna uczy się tego sama – z obserwacji własnego odbicia w lustrze oraz z obserwacji ludzi. Robot zaśpiewał już piosenkę ze swojego debiutanckiego albumu – wygenerowanego przez sztuczną inteligencję.

Robot, który potrafi śpiewać

.Prawie połowa ludzkiej uwagi podczas rozmowy twarzą w twarz skupia się na ruchu warg – przypominają eksperci z Columbia University (USA). Jednak nawet najbardziej zaawansowane humanoidy wykonują zwykle niewiele więcej niż najprostsze ruchy ust. Ponadto, ponieważ ludzie wychwytują najmniejsze mimiczne gesty, kiedy robot naśladuje mowę, często wydaje się nienaturalny. Według niektórych prognoz w ciągu najbliższej dekady wyprodukowanych zostanie ponad miliard humanoidów – przypominają eksperci.

Na łamach pisma „Science Robotics” badacze opisali tymczasem robota, który jest w stanie nauczyć się ruchów warg potrzebnych do zadań takich jak mowa i śpiew.

W dotychczasowych demonstracjach maszyna wykorzystała swoje umiejętności do artykułowania słów w różnych językach, a nawet do zaśpiewania piosenki ze swojego wygenerowanego przez sztuczną inteligencję, debiutanckiego albumu, zatytułowanego „hello world”.

Co ważne, robot nabył tę umiejętność poprzez naukę przez obserwację, a nie za pomocą sztywnych reguł. Najpierw nauczył się korzystać ze swoich 26 silników twarzowych, oglądając własne odbicie w lustrze, a następnie nauczył się naśladować ruchy ludzkich warg, oglądając godzinami filmy na YouTube.

„Im częściej będzie wchodzić w interakcje z ludźmi, tym lepszy się stanie” – uważa twórca wynalazku, prof. Hod Lipson. Naukowcy przyznają jednak, że ruch warg jest jeszcze daleki od ideału.

Robotyka humanoidalna

.„Mieliśmy szczególne trudności z twardymi głoskami, takimi jak »b«, oraz z dźwiękami wymagającymi ściągnięcia warg, takimi jak „w”. Jednak te umiejętności prawdopodobnie poprawią się wraz z czasem i praktyką” – mówi prof. Lipson. Co kluczowe, synchronizacja warg ma być elementem bardziej holistycznej zdolności robota do komunikacji.

„Kiedy umiejętność synchronizacji ruchu warg zostanie połączona z konwersacyjną sztuczną inteligencją, taką jak ChatGPT czy Gemini, nada to zupełnie nową głębię więzi, jaką robot tworzy z człowiekiem” – podkreśla prof. Yuhang Hu, jeden z badaczy. Naukowcy wierzą, że ekspresja twarzy jest „brakującym ogniwem” w rozwoju robotyki.

„Większość dzisiejszej robotyki humanoidalnej koncentruje się na ruchach nóg i rąk, w celu wykonywania czynności takich jak chodzenie czy chwytanie. Jednak ekspresja twarzy jest równie ważna w przypadku wszelkich zastosowań robotycznych wymagających interakcji z człowiekiem” – zwraca uwagę prof. Lipson.

Badacze przewidują, że przyjazne, realistyczne twarze będą stawać się coraz ważniejsze, w miarę jak roboty humanoidalne znajdą zastosowanie w takich dziedzinach jak rozrywka, edukacja, medycyna, a nawet opieka nad osobami starszymi.

Sztuczna inteligencja, czyli nowy koszmar dla obrońców klimatu

.Według dominującej narracji przyczyną zmian klimatycznych są antropogeniczne emisje dwutlenku węgla, które powodują ocieplanie atmosfery. To z kolei wywołuje szereg dodatnich sprzężeń zwrotnych, wzmacniających efekt cieplarniany. Przykładem jest wzrost koncentracji pary wodnej w cieplejszej atmosferze, która również jest gazem cieplarnianym. Jednak dużo większym zmartwieniem dla klimatystów kierujących się maksymą „całe zło to CO₂” powinien być rozwój AI – pisze prof. Ziemowit Miłosz MALECHA.

Eric Schmidt, były CEO Google, wypowiedział się publicznie na temat energochłonności infrastruktury związanej z AI. Zrobił to w dość alarmistyczny sposób, przekonując, że już niedługo 99 proc. wytwarzanej energii może być konsumowane przez centra danych oraz centra obliczeniowe. Wezwał tym samym decydentów w USA do budowy nowych instalacji wytwórczych z wykorzystaniem wszystkich możliwych technologii.

Schmidt przewiduje, zgodnie z obserwowanymi trendami, że w samych Stanach Zjednoczonych na potrzeby technologii cyfrowej do 2030 roku potrzebne będzie dodatkowych 30 GW mocy, a do 2035 roku już 67 GW. Są to wielkości gigantyczne. Dla porównania: średnie zapotrzebowanie mocy elektrycznej w Polsce to ok. 19 GW. Należy podkreślić, że centra obliczeniowe i danych nie mogą polegać na wietrze i słońcu, gdyż jest to energia niestabilna i droga. AI wymaga energii najwyższej jakości – taniej, stabilnej i pozbawionej zakłóceń w dostawie. Z tego właśnie powodu korporacje Big Tech wyraziły swoje stanowisko ustami Billa Gatesa, który odstawił „ratowanie planety” na boczny tor, wskazując, że na świecie są pilniejsze potrzeby. Zielony PR odchodzi więc do lamusa, ważniejsze są modele językowe.

Z drugiej strony obserwujemy prawdziwy wyścig z czasem między największymi konkurentami, USA i Chinami. W tym wyścigu USA nie mogą odpuścić nawet na milimetr, zwłaszcza że oddech Chin czują już na swoich plecach. Nie mogą odpuścić, bo uzyskanie znaczących przewag technologicznych w AI przez ChRL oznaczałoby koniec prymatu USA, co byłoby niebezpieczne również dla nas. I nie chodzi tutaj tylko o samą AI, lecz o wszystko to, co za jej pomocą można osiągnąć w dziedzinie techniki, biologii, nauk podstawowych oraz technologii.

Dlaczego więc możemy mówić o AI jako o najsilniejszym dodatnim sprzężeniu zwrotnym w kontekście zmian klimatycznych? Ponieważ skoro w USA przewiduje się takie wzrosty zapotrzebowania na energię elektryczną, to analogiczne będzie, a nawet już jest w Chinach, Indiach, Rosji i wszędzie tam, gdzie poważnie myśli się o technologiach AI. Skalując powyższe liczby, można zauważyć, że w najbliższym czasie potrzebne będą setki, a może i tysiące gigawatów nowych źródeł stabilnej i taniej energii.

Teks dostępny na łamach Wszystko co Najważniejsze: https://wszystkoconajwazniejsze.pl/prof-ziemowit-milosz-malecha-sztuczna-inteligencja-czyli-nowy-koszmar-dla-obroncow-klimatu/

PAP/ Marek Matacz/ LW

Materiał chroniony prawem autorskim. Dalsze rozpowszechnianie wyłącznie za zgodą wydawcy. 16 stycznia 2026