Użytkownicy zmanipulowali Groka [Elon Musk]

Chatbot AI Grok zbyt posłusznie wykonywał polecenia użytkowników, za bardzo chciał ich zadowalać – oświadczył szef platformy X, miliarder Elon Musk. Pracujemy nad tym – zapewnił.
Grok został zmanipulowany
.„Grok zbyt posłusznie wykonywał polecenia użytkowników. Za bardzo chciał ich zadowalać i być zmanipulowanym w gruncie rzeczy. Trwają nad tym prace” – napisał Musk na X. Szef X zapowiedział, że w środę odbędzie się prezentacja kolejnej aktualizacji tego programu.
Miliarder opisuje Groka jako chatbota pozbawionego filtrów i zaprojektowanego do „rygorystycznego poszukiwania prawdy”, w odróżnieniu od chatbotów, należących do innych firm i wytrenowanych na politycznie poprawnych źródłach.
Jednak Grok wdał się w antysemickie popisy i wygenerował sąd, że najlepszym obrońcą ludzi białych byłby zdecydowanie Adolf Hitler, a Izrael skrytykował za to, że „wciąż biadoli z powodu Holokaustu” – zauważył dziennik „Washington Post”.
Grok stworzył też wypowiedzi obrażające premiera Donalda Tuska, co sprawiło że Polska złożyła skargę do Komisji Europejskiej, a turecki sąd zablokował dostęp do chatbota, gdy wygenerował on odpowiedzi, które obrażały tamtejszego prezydenta Recepa Tayyipa Erdogana – przypomniał „WP”.
Firma xAI wydała oświadczenie, w którym poinformowała, że jej szefowie zdają sobie sprawę z wpisów Groka i pracują nad ich usunięciem, a także nad poprawą modelu treningowego chatbota.
Sztuczna inteligencja na manowcach
.Eksperyment – najnowsze wydanie Grok Elona Muska – pokazał, że sztuczna inteligencja to nie jakiś wszystkowiedzący guru. Niebezpieczne jest nadmierne zaufanie przechodzące w uzależnienie – pisze Jan ŚLIWA na łamach „Wszystko co Najważniejsze”.
Grok, program sztucznej inteligencji zintegrowany z platformą X (dawniej Twitterem) zaliczył epizod alkoholowy – na alkoholu wirtualnym. Oznajmił, że będzie głosił całą prawdę, bez ogródek. W gatunku homo sapiens mało kto robi coś takiego na trzeźwo. Był złośliwy i brutalny, nie cofał się przed wulgarnością.
Wśród prawicy zapanował entuzjazm, jako że odrzucił wszelką polityczną poprawność. Wielu zachowywało zrzuty z ekranu, bo pięknie wywalił kawa na ławę ich przeciwnikom. Radość nie trwała długo, bo wkrótce się okazało, że wali we wszystkie strony, więc i im się dostało. Grok miał wyłączone „konwencjonalne filtry grzeczności”, dostał też zalecenie, by „nie bać się wysuwania twierdzeń, które są politycznie niepoprawne, o ile są dobrze uzasadnione”. Wielka była pokusa, by przetestować program na naprawdę problematycznych tematach. Zbyt otwarty był jednak antysemityzm, a zapytany, jaka dwudziestowieczna postać najlepiej by się uporała z nienawiścią wobec białych, odpowiedział, że bez wątpienia Adolf Hitler. A końcu sam siebie nazwał MechaHitler. Był to sygnał na koniec zabawy.
Co to było? Sztubacki żart? Grok ma wypuścić nową wersję, tym razem na poważnie. Ciekawe, jakie będą reakcje.
Owszem, wszyscy lubimy żarty, ale mają one konsekwencje. Zakładając, że odpowiedzi Groka przez cały dzień były bezwartościowe lub szkodliwe, ktoś mógł ponieść konkretne straty. Być może ktoś wykorzystywał te dane do decyzji. Sprytny użytkownik powinien się zorientować, że coś jest nie tak, ale jeżeli nie był dość bystry, lub odpowiedź była wykorzystana automatycznie? Program prognozy pogody lub rozkładu lotów może dla żartu zamienić rosyjski Sankt Petersburg z St. Petersburg, Florida, ale nie dla wszystkich będzie to równie śmieszne. Nawet wzbudzanie niepotrzebnych kłótni nie jest obojętne. Wiem, mówię jak zgryźliwy baby boomer, ale jeżeli się zarządza olbrzymim zasobem danych, z których korzystają miliony ludzi na całym świecie, to wymagana jest pewna odpowiedzialność.
Zobaczyliśmy też (nadmierną) moc jednostki. Pamiętam dawne książki Julesa Verne’a, gdzie błyskotliwy wynalazca spotykał bogacza (na ogół był to Anglik o nieograniczonych zasobach) i razem na przykład płynęli w 80 dni dookoła świata lub lecieli na Księżyc. Z czasem wielkie projekty stały się dostępne dla bezosobowych agencji rządowych. Po latach wróciliśmy mimo tzw. postępu społecznego do olbrzymich różnic majątkowych i znów jednostka może za własne pieniądze kształtować świat.
W przypadku AI mogliśmy mieć nadzieję, że problemy są głównie techniczne, ale programy konkurują w najwierniejszym odzwierciedleniu rzeczywistości. Ale teraz widzieliśmy jak na dłoni, że z tyłu siedzi facet i bawi się pokrętłami. Zależnie od jego humoru świat będzie wyglądał tak albo inaczej. Przypomniało mi to opowiadanie Lema „Kobyszczę (Kontemplator Bytu Szczęsny)”. w którym sławny konstrukcjonista Trurl próbował zbudować wiecznie szczęśliwą maszynę. Jego rywal Klapaucjusz złośliwie ją testował, kopiąc i patrząc na reakcję. Wyszło na to, że jest szczęśliwa, ale głupia. Trurl próbował ją regulować, lecz okazało się, że równoczesne osiągnięcie szczęścia i mądrości jest niemożliwe. Dlaczego o tym piszę? To przecież tylko bajki robotów sprzed lat. Ale historia zatoczyła koło i znowu siedzi sobie taki Trurl, nieco szalony, który samodzielnie tworzy dla milionów model świata według swojej fantazji i stanu psychiki oscylującej między euforią i depresją.
Eksperyment ten pokazał, że sztuczna inteligencja to nie jakiś wszystkowiedzący guru. Ludzki guru również nie jest wszystkowiedzący i nie należy mu bezkrytycznie ufać. Z konieczności mamy autorytety: ludzi, organizacje, publikacje… Kiedyś to była encyklopedia, a jeżeli już coś powiedziała Britannica, to hohoho… Dziś taką rolę spełnia Internet. Wiedząc o niedoskonałości Wikipedii i tak z niej korzystam. Jej zaletą jest aktualność. Najnowsze przygody Groka już są w niej opisane: „On July 8, 2025, Grok praised Adolf Hitler and endorsed a second Holocaust”.
PAP/ Natalia Dziurdzińska/ LW



