ElevenLabs. Spółka dwójki Polaków pięknym europejskim sukcesem [Le Figaro]

Spółka Matiego Staniszewskiego i Piotra Dąbkowskiego ElevenLabs, która specjalizuje się w zamienianiu tekstu na mowę i klonowaniu głosu, została uznana przez najpoważniejszy dziennik francuski „Le Figaro” za jeden z najpiękniejszych europejskich sukcesów.
ElevenLabs z nazwą nawiązującą do święta narodowego ich kraju – Polski
„Le Figaro” opisuje jak to dwójka młodych Polaków, rozczarowanych marną jakością dubbingu amerykańskich filmów, które oglądali w dzieciństwie, w ciągu czterech lat wyrosła na jeden z największych europejskich start-upów w dziedzinie sztucznej inteligencji.
W najnowszej, ostatniej rundzie finansowania, wyceniono ją na 11 miliardów dolarów (9,3 mld euro). A rundę finansowania poprowadził amerykański fundusz Sequoia, czyniąc ElevenLabs jednym z najwyżej wycenianych start-upów Starego Kontynentu, tuż obok francuskiego Mistrala (11,7 miliarda euro). W Londynie, Nowym Jorku, Warszawie, Bangalore i Tokio firma zatrudnia 300 osób.
Klonowanie głosu i traktowanie głosu jako mechanizmu sterującego interfejsem sztucznej inteligencji – to złote runo, po które udali się Polacy rozwijając swoją spółkę.
Wcześniej dwójka Polaków ze szkolnej ławy Mati Staniszewski Piotr Dąbkowski zyskali doświadczenie w Google i Palantirze. W styczniu 2023 roku zaprezentowali pierwsze oprogramowanie do generowania dźwięku, przy czym każdy tekst można było odtąd odczytać na głos, wybierając spośród niezliczonych barw i intonacji. Efekt był o lata świetlne oddalony od mechanicznych tonów asystentów takich jak Siri czy Alexa. Zaledwie dwadzieścia miesięcy po premierze spółka osiągnęła tempo 100 milionów dolarów rocznych powtarzalnych przychodów. Pojawiły się pierwsze kontrakty z aplikacjami do nauki języków i medytacji oraz z wydawcami, takimi jak HarperCollins czy Bertelsmann.
„Nazwa spółki nawiązuje do 11 listopada, święta niepodległości ich ojczyzny” – pisze „Le Figaro”.
„Le Figaro” zafascynowane sukcesem Polaków
„Le Figaro” nie kryje zafascynowania tym, co zaprezentowali Polacy: jakością brzmienia z najsubtelniejszymi niedoskonałościami ludzkiej mowy — oddechem, ledwie słyszalnymi szmerami ust, ironią, niepokojem. Dzięki wynalazkowi Polaków to już nie monotonna, użytkowa transkrypcja, lecz żywa, pulsująca mowa, do tego z obszerną, wielojęzyczną biblioteką liczącą aż 10 tysięcy głosów.
Francuski dziennik nie omija problemów, jakie pojawiły się, gdy ich firma została pozwana przez aktorów dubbingowych, którzy zarzucali spółce wykorzystywanie ich głosów do trenowania modeli bez ich zgody. Innym kryzysem, który uderzył w dwójkę Polaków, było użycie technologii do podszycia się pod aktorkę Emmę Watson — w sieci rozpowszechniano fałszywe nagrania jej głosu czytającego „Mein Kampf”. Po tych doświadczeniach Polacy przyznali, że choć jej technologia służy głównie dobrym celom, rośnie liczba nadużyć związanych z klonowaniem głosu, a mówienie cudzym głosem rodzi poważne pytania etyczne. Firma wprowadziła więc solidne zabezpieczenia: zatrudniła moderatorów, ograniczyła możliwość używania głosów niektórych osób publicznych, wprowadziła system weryfikacji zgody i bezpłatny detektor deepfake’ów.
„Le Figaro” kibicuje kolejnym sukcesom Polaków. Dziś ElevenLabs kieruje się także ku wideo — chce umożliwić generowanie filmów na podstawie dźwięku, co oznacza wejście w rywalizację z gigantami technologicznymi, w tym z aplikacją Sora od OpenAI. „W świecie, w którym technologie błyskawicznie powszednieją, start-up musi innowować szybciej niż inni, by nie utracić swojego głosu w kakofonii przyszłości” – zauważa „Le Figaro”.
Le Figaro/AJ








