Kreatywność sztucznej inteligencji w grze „głuchy telefon” ujawnia jej ograniczenia

Kreatywność sztucznej inteligencji w grze „głuchy telefon” okazuje się ograniczona, gdy modele bez udziału człowieka szybko popadają w schematyczność.
.Generatywna sztuczna inteligencja jest często przedstawiana jako narzędzie zdolne do samodzielnej twórczości i nieograniczonej wyobraźni. Najnowsze badania pokazują jednak, że gdy AI zostaje pozostawiona sama sobie, jej kreatywność szybko się wyczerpuje. Badanie zostało opublikowane w recenzowanym czasopiśmie naukowym Patterns, które specjalizuje się w analizie danych, sztucznej inteligencji i złożonych systemów.
Badacze zaprojektowali eksperyment inspirowany grą w „głuchy telefon”, ale w wersji wizualnej. W pierwszym kroku model generujący obrazy, Stable Diffusion XL, tworzył ilustrację na podstawie krótkiego, maksymalnie 30-słownego opisu. Następnie inny model, LLaVA, opisywał wygenerowany obraz, a ten opis trafiał z powrotem do generatora. Proces powtarzano nawet 100 razy dla jednego promptu, a całość przeprowadzono dla 100 różnorodnych scen wyjściowych, obejmujących zarówno abstrakcyjne emocje, jak i sytuacje polityczne, czy krajobrazy.
Zamiast zachować spójność z pierwotnym pomysłem, modele niemal zawsze zaczynały odbiegać od tematu. Po kilkudziesięciu iteracjach obrazy traciły pierwotne znaczenie i koncentrowały się wokół wąskiej grupy motywów. Analiza końcowych ilustracji wykazała, że AI konsekwentnie zbiegała do zaledwie 12 tematów, takich jak gotyckie katedry, krajobrazy naturalne, sceny sportowe, nocne miasta czy latarnie morskie podczas burzy. Co istotne, zjawisko to występowało niezależnie od długości opisu początkowego oraz od poziomu losowości ustawionego w modelach.
.Zdaniem autorów badania przyczyną tej konwergencji są dane treningowe. Modele uczą się na milionach obrazów tworzonych i wybieranych przez ludzi, a więc odzwierciedlają to, co najczęściej fotografujemy i udostępniamy. W efekcie AI nie generuje nowych estetyk, lecz odtwarza statystyczne „średnie” kultury wizualnej. Jak podkreślają badacze, brakuje tu drugiego kluczowego elementu kreatywności: zdolności selekcji i oceny tego, co naprawdę interesujące, odważne lub znaczące.
.Wnioski z eksperymentu mają istotne konsekwencje dla wykorzystania sztucznej inteligencji w sztuce, nauce i mediach. Pozostawione bez nadzoru modele mogą przyspieszać kulturowe ujednolicanie zamiast ją przełamywać. Autorzy sugerują, że utrzymanie człowieka „w pętli decyzyjnej” jest niezbędne, jeśli AI ma wspierać różnorodność twórczą, a nie ją ograniczać. Jednocześnie badanie wskazuje na potrzebę projektowania mechanizmów przeciwdziałających konwergencji, które pozwoliłyby modelom dłużej eksplorować nieoczywiste kierunki. Na dziś jednak kreatywność AI okazuje się bardziej odtwórcza niż przełomowa.
Oprac: SŚ



