Sztuczna inteligencja odgrywa coraz większą rolę w naszym codziennym życiu. Całkiem niedawno pojawiło się rozwiązanie o nazwie Midjourney – model AI, który generuje spektakularne grafiki na podstawie wpisywanego tekstu. Wygenerowane obrazy w niczym nie ustępują tym stworzonym przez prawdziwych artystów. Stoimy u bram rewolucji, która na zawsze odmieni oblicze projektowania. Co to oznacza dla branży reklamowej? O tym właśnie rozmawiają Łukasz Myszkowski – szef agencji Directors, który zastanawia się, jaka przyszłość czeka reklamę, Filip Kuźmiński – dyrektor kreatywny, nasz największy entuzjasta AI, który zgłębia z pasją i na bieżąco możliwości nowego narzędzia oraz Marcin Piontek, prawnik z kancelarii prawniczej Piontek, który sygnalizuje problemy jakie może nieść korzystanie ze sztucznej inteligencji.
Łukasz: Od kilku miesięcy masz ewidentną zajawkę – widać to po Twoich social mediach. Co w AI szczególnie wzbudza Twój entuzjazm?
Fil: Wychowałem się na fantastyce, a rozwój technologii kręcił mnie odkąd pamiętam. Coś, co na początku wydawało się nierealne i poza naszymi marzeniami, nagle zostało podane nam na tacy. Dostaliśmy do rąk boskie narzędzia kreacji, gdzie słowo staje się ciałem. Szok.
Ł.: I dużo osób się już w to wkręciło?
F.: Patrząc po moich znajomych – sporo. Ale wiadomo siedzę w bańce podobnych do mnie kreatywnych freaków. Na dzień 6.10.2022 discordowy serwer Midjourney przekroczył 3 miliony zarejestrowanych kont z ok. 400 tysiącami użytkowników on-line. Największa grupa na Facebooku zrzesza 182 tysiące ludzi. W sumie niewiele w skali światowej, ale całkiem dobre tempo przyrostu, przyjmując za początek hajpu otwarcie publicznej bety Midjourney 12 lipca.
Ł.: Co jest przyczyną tak nagłej popularności tych narzędzi?
F: Łatwość kreowania, jakość sięgająca fotorealizmu, a przede wszystkim – wyjście z fazy zamkniętych beta testów. Koniec elitarnych kręgów – teraz każdy może tworzyć niesamowite rzeczy, dosłownie z palca.
Ł.: Czy Twoje doświadczenia dotyczą tylko grafiki? Czy znasz tego typu narzędzia do tworzenia muzyki albo innych multimediów?
F.: Temat rozwija się bardzo dynamicznie i obejmuje już różne dziedziny kreacji – muzykę, grafikę, animację, video, gaming, programowanie, pisanie artykułów, scenariuszy. Z racji tego, że zaraz po grafice najbliżej mi do muzyki, tak, mam już pewne doświadczenia. W zeszłym roku kupiłem program, który dzięki AI pomaga mi w niezwykle łatwy sposób zarządzać gigantyczną biblioteką sampli.
Ł.: Na jakiej zasadzie to działa?
F.: Po przeanalizowaniu wszystkich próbek dźwiękowych dostałem interpretację graficzną zawartości folderów w postaci mind mapy z podziałem na kategorie sampli. Dodatkowo są pogrupowane brzmieniowo tak, aby jak najlepiej do siebie pasowały. Totalny kosmos. Dzięki AI udało się też „namówić” 2Paca, aby zarapował napisany przeze mnie tekst :).
Ł.: A jak to się może potoczyć dalej według Ciebie? Czy logika podpowiada Ci, co w następnej kolejności powinno nastąpić?
F.: To zależy, jakie ramy czasowe przyjmiemy i jak daleko myślami wybiegniemy do przodu. W krótkim terminie – na pewno będziemy zaskakiwani kolejnymi postępami AI i zupełnie nowymi możliwościami kreacji. Już w trakcie redagowania naszej rozmowy wiele się wydarzyło i zdążyło pozmieniać. Chociażby Meta AI pokazało zaawansowane prace nad systemem zamieniającym tekst w wideo. A w dłuższym czasie? No cóż… Temat jest niezwykle szeroki i złożony. Ciężko wyrokować, co dalej. Mamy do czynienia z ogromną rewolucją, która musi się dopiero przez nas przelać, abyśmy w pełni ocenili skalę oddziaływania. Wydaje mi się, że AI stanie się powszechnym narzędziem, które zostanie zaimplementowane w każdym możliwym programie do kreacji – czy to w Photoshopie czy innym ustrojstwie do tworzenia animacji, 3d, muzyki…
Ł.: Myślisz, że to będzie taki dodatkowy plug-in?
F.: Może plugin, a może wszystko odbywać się będzie w chmurze z poziomu strony internetowej, czy apki na telefonie i w zasadzie dodatkowe programy nie będą już potrzebne. Nie mam pojęcia. Sam jestem ciekaw.
Ł.: A czy zauważyłeś pewną tendencyjność w grafice generatywnej (bo chyba tak ją najlepiej określać)? Mam wrażenie, że tonality wielu z tych obrazów jest mocno bym powiedział… Horrorowa :).
F.: Moim zdaniem trafne określenie, choć ja może tochę bezczelnie, ale dla własnej wygody stosuję termin „sztuka generatywna”. Przy okazji zapraszam na facebookową grupę Sztuka Generatywna, gdzie wymieniamy się wizjami, doświadczeniami i nowinkami ze świata AI. Cóż… Generowanie gore wynika z ludzkiej natury. Nigdy wcześniej nie było możliwości zobaczenia niemal dowolnej ikony popkultury pokrojonej na plasterki, czy w charakterze nadgniłego zombie w barokowej oprawie, cyberpunkowych kolorach i metalowymi mackami zamiast kończyn. Ludzie sprawdzili, da się wygenerować naprawdę zwyrolskie akcje, ale po zaspokojeniu ciekawości na regularnych użytkownikach nie robi to większego wrażenia. Wyścig (który niestety powoli wkrada się i tu) toczy się o pomysł i hiperrealizm, a najlepiej, gdy jedno idzie w parze z drugim.
Ł.: Czyli jest to taki trochę pojedynek na słowa-klucze. Jak to faktycznie działa? Jakich patentów się używa, żeby skutecznie briefować algorytm – uzyskać efekt, o który chodzi i niebanalne, niegeneryczne rezultaty? To jest proces wielostopniowy, o ile mi wiadomo…
F.: Midjourney obsługujesz z poziomu chatbota na Discordzie. Wpisywane instrukcje dla AI nazywamy promptem. Od jego konstrukcji w dużej mierze zależy jaki charakter czy też rodzaj grafiki wygenerujesz. Jeśli zbyt wiele nie oczekujesz, zbyt wiele nie dostaniesz. Osoby, które dopiero zaczynają przygodę z Midjourney nie są nawet świadome, jak głęboko można wejść w temat. Tu widać, kto jest świeży. Pierwsze prace zazwyczaj są bardzo generyczne albo koślawe. Prosty prompt „happy girl” wałkowany w nieskończoność przez miliony użytkowników, co prawda nigdy nie wygeneruje dwa razy tej samej twarzy, ale nie sprawi, że któraś z nich będzie się wyróżniać. To jest pułapka, której należy się wystrzegać. Całe szczęście ludzie szybko się uczą.
Ł.: Czyli podstawą jest dobry prompt?
F.: Zdecydowanie. Żeby uzyskać coś unikatowego, trzeba postarać się w wyrafinowany sposób opisać interesujący nas obiekt. Na przykładzie portretu – rasa, płeć, wiek, wyraz twarzy, emocje, kolor oczu, znaki szczególne, fryzurę, makijaż, nakrycie głowy, ubiór, cechy charakteru, uosobienie, może jakieś atrybuty, miejsce, epokę, porę dnia, rodzaj światła, aż po nawiązania do stylu konkretnych artystów oraz użytych narzędzi. Można pełnymi zdaniami, a najlepiej ze słownikiem synonimów. Do tego parametry techniczne – proporcje, stopień szczegółowości, zgodności z promptem, przestrzeń na improwizację, rodzaj silnika renderującego. A to dopiero wstęp. Pierwsze rozdanie kart. Potem następuje ta wielostopniowość, o której wspominałeś. Modyfikowanie promptu, generowanie kolejnych wersji, wybieranie najlepiej rokujących iteracji, generowanie następnych i następnych, nierzadko powyżej setki. Dlatego używam terminu sztuka generatywna. Sztuką w tym wypadku jest proces twórczy, który potrafi wciągnąć na całą noc.
Ł.: Więc może już niedługo przestaną być tak istotne graficzne umiejętności, doświadczenie, a bardziej będzie się liczyła się wirtuozeria w konstruowaniu promptów?
F.: Talent, doświadczenie i wyobraźnia były, są i będą w naszej branży czymś bezcennym. I to się nie zmieni. A prompty to etap przejściowy. Będziemy je wspominać równie często i z rozrzewnieniem, jak obecnie telegrafy, czyli wcale.
Ł.: Uwzględniając Twoje art directorskie doświadczenie, myślisz, że tego typu rozwiązania mają przyszłość w tworzeniu projektów komercyjnych, w odpowiedzi na konkretny brief? Przyspieszą je, nadadzą im jakąś unikalność?
F.: Przede wszystkim przyspieszą. Widzę rolę AI jako osobistego asystenta kreatywnego, który w każdej chwili gotowy jest z Twoich pomysłów wygenerować dowolną ilość równie ciekawych alternatyw. Nie tylko na poziomie graficznym, ale także big idei. Mam już na koncie swój pierwszy komercyjny projekt wykorzystujący możliwości AI.
Ł.: O, a możesz zdradzić czego dotyczył?
F.: Chodziło o grafikę na koszulkę.
Ł.: Wygenerowaną w minutę?
F.: No nie do końca. Stworzyłem dwa prompty, które rozwinąłem do kilkudziesięciu wersji. Następnie połączyłem motywy, podmalowałem parę rzeczy, zwektoryzowałem grafikę i dodałem typografię. Efekt zwalał z nóg. Zajęło mi to może ze dwie i pół godziny, łącznie z napisaniem maila i wysłaniem plików. Klient był bardzo zadowolony, a ja miałem satysfakcję z dobrze wykonanej roboty. Wspaniałe uczucie. Chciałbym móc w ten sposób pracować częściej. Niestety, nie zawsze się da.
Ł.: A gdybyśmy wybiegli wyobraźnią w przyszłość i pozwolili sobie na odrobinę wizjonerstwa w tym zakresie… Czy marki są w stanie stworzyć swój dedykowany algorytm, który będzie im generował specyficznie nacechowany content? Już teraz marki mają swoje bazy zdjęć czy jednolitych materiałów do wykorzystania. Wtedy agencja byłaby zbędna! Pracowałoby się tylko z szybkim i odpornym na krytykę algorytmem. Wystarczyłoby lekkie podprodukowanie materiału – zdjęciowego, graficznego czy muzycznego… I kampania gotowa!
F.: Sztuczna inteligencja będzie Ci generować to, czym ją nakarmisz. Jeżeli wytrenujesz ją contentem marki (który, jak kreatywny by nie był, nigdy nie będzie mógł się równać z dorobkiem artystycznym całej ludzkości na przestrzeni dziejów), dostaniesz zaledwie generyczny content danej marki. Fajne wsparcie dla działu marketingu, ale w obrębie tej samej kampanii. Póki AI nie uzyska samoświadomości możemy spać spokojnie. Agencja nadal będzie potrzebna jako organ kreatywny, dostarczający wizję i rozwiązania.
M.: czytałem, że AI wykończy prawników. Biorąc pod uwagę zdolność ustawodawcy do tworzenia przepisów wewnętrznie sprzecznych oraz kreatywność obywateli w ich obchodzeniu, parę lat jeszcze mam (śmiech).
Ł.: Wróćmy do samego efektu. Pamiętam, że gdy zaczął się ten boom na sztuczną inteligencję, Midjourney itd., doceniałeś upgrade jakościowy – to, że dostarczone pliki graficzne zaczynają już mieć jakość, która wystarcza nie tylko do pokazania ich na wyświetlaczu smartfona, ale też do stworzenia większych formatów. Na jakim to jest teraz etapie?
F.: Można już wygenerować dowolną rzecz w jakości niemal fotograficznej. Nadal są pewne problemy, szczególnie z anatomią ludzkich rąk czy randomowymi deformacjami. Nie lada wyzwaniem są też scenki rodzajowe, w których obiekty na siebie oddziałują. Ale heloł, nie ma co marudzić. Ogarną i to. Parę lat temu szczytem możliwości generowania obrazu przez AI była zielona, psychodeliczna breja z kocim futrem i psimi oczami, którą wszyscy się zachwycaliśmy. Natomiast symulacje tradycyjnego malarstwa, grafiki warsztatowej, rzeźby, nie stanowią dla AI najmniejszego problemu. O rozdzielczość też nie ma co się martwić. Od kilku lat funkcjonują naprawdę świetne modele AI do upscalingu, pozwalające ze zdjęć wielkości paczki fajek robić plakaty.
Ł.: A co będzie dalej twoim zdaniem? Czy jest z poziomu praw autorskich możliwość, żeby prace wygenerowane przez sztuczną inteligencję były obiektem kontraktów? Już na stockach one się pojawiają, natomiast niektóre stocki wycofały się z oferowania prac tworzonych przy wykorzystaniu sztucznej inteligencji, właśnie ze względu na niejasną sytuację, jeśli chodzi o prawa autorskie.
F.: Na prawie to ja się znam tyle, co przesuń w lewo, przesuń w prawo ;). Trzeba by prawnika futurologa zapytać.
M.: To już nie futurologia. „Jutro to dziś, tyle że jutro.” 😉 Stajemy przed szeregiem pytań, na które trzeba odpowiedzieć. Parę luźnych przykładów: AI to narzędzie. Narzędzie należy do właściciela. Do kogo należą więc prace wykonane z użyciem sztucznej inteligencji? Do właściciela sztucznej inteligencji czy do osoby, która wykorzystuje AI w procesie twórczym? Kto ponosi odpowiedzialność za te prace i jaki jest jej zakres? To nie są błahe sprawy, a odpowiedź na jedno z pytań będzie prowadzić do paru kolejnych. Jeśli np. przyjmiemy, że właściciel użycza twórcy prawa do korzystania ze sztucznej inteligencji, to teoretycznie możemy przyjąć, że udziela licencji. Ta zapewne będzie opisana w długich warunkach użytkowania, które każdy klika, a praktycznie nikt nie czyta. Problemu nie będzie, jeśli dany utwór będzie nosić charakter indywidualny i nie będzie naruszać prawa. Tak jest np. w przypadku korzystania z filtrów neuralnych w Photoshopie. Jednak co jeśli AI postanowi powielać dany utwór w pracach różnych twórców? Lub co najmniej powtarzać motywy? Były już takie przypadki. Problemem jest też to, że nie wiemy jak sztuczna inteligencja działa i „myśli”. Jeśli np. przetwarza dzieła czy wizerunki ludzi z krwi i kości, to mogą się pojawiać pytania o plagiat i naruszenie dóbr osobistych. Temat rzeka.
Ł.: Czy jakąś konkluzję można by z tej dyskusji wyciągnąć? Naszą ocenę sytuacji? Faktem jest, że mamy coraz więcej nowych zjawisk, wynikających z zastosowania algorytmów. Mówiliśmy o grafice, Midjourney itp., ale są też rozwiązania muzyczne, generujące content słowny – tekstowy czy animacje. Moc obliczeniowa i możliwości rosną bardzo szybko i rozwiązania wygenerowane przez AI będą odgrywać coraz większą rolę w naszej rzeczywistości medialnej. Do czego to może prowadzić? Do jakich zmian na przykład na rynku pracy – nie tylko w marketingu czy reklamie, ale i innych branżach?
F.: Gorąco polecam odświeżyć sobie temat rewolucji przemysłowej z XVIII wieku. Myślę, że mamy do czynienia z podobnym, jak nie większym kalibrem. Do tego wgniatające w fotel tempo zmian. Nie ma tygodnia bez kolejnego przełomu. Nie mogę doczekać się, co dalej. Chcę już te parę lat do przodu!
Ł.: A co będzie, kiedy możliwości tych różnych rozwiązań połączą się i będą mogły same siebie udoskonalać i rozwijać?
F.: Na to liczę!
Ł.: I zyskają autonomię… Zaczną stymulować ekonomię, politykę, nastoje społeczne, show business, dążąc do jakichś celów. Pytanie, czyje to będą cele?
F.: Witamy w świecie teorii spiskowych!
M.: Czy spiskowych? Jeśli słyszało się o aferze Cambridge Analytica, systemach profilowania przestępców testowanych w USA, czy o systemie punktowania obywateli Chin, który rozpoznaje ich nie tylko po twarzach, ale i po kroku to wiadomo, że z algorytmów można korzystać na różne sposoby. Skoro tak, o ile to się już nie dzieje, to kwestią czasu jest by zaczęto do podobnych działań wykorzystywać sztuczną inteligencję. Jeśli dodamy do tego możliwości manipulacji jakie daje „deep fake”, to robi się trochę jak w powieściach Philipa K. Dicka, gdzie możemy nie wiedzieć co jest ułudą, a co rzeczywistością. Prawo ma nas bronić przed tego rodzaju zagrożeniami. W tym nasze prawo do prywatności. Te może być naruszane na wszelkie możliwe sposoby. Od zbierania danych wrażliwych, po profilowanie w dowolnym celu, czy zgoła fabrykowanie dowodów z wykorzystaniem informacji o każdym za nas. W kategoriach prawnych czysta dystopia, której trudno zapobiec, gdy dowolny cykl legislacyjny trwa dłużej, niż kreatywne działanie sztucznej inteligencji i jej użytkowników. Ze względu na samą naturę prawa, regulacja będzie zostawała w tyle. Jednak niektóre problemy możemy przewidzieć już teraz i już teraz trwają prace legislacyjne. W Polsce zajmuje się nimi Ministerstwo Cyfryzacji, na poziomie unijnym opracowywane jest rozporządzenie Parlamentu Europejskiego i Rady ustanawiającego zharmonizowane przepisy dotyczące sztucznej inteligencji. Ale, jak mawiał Kipling, „to już zupełnie inna historia”, którą opowiem Wam przy okazji. Niewątpliwie żyjemy w ciekawych czasach i wiele będziemy musieli się nauczyć.
Ł.: Tak, to jest nasz ludzki algorytm – szukanie spisku na zapleczu spektakularnych wydarzeń… Dzięki za rozmowę Fil oraz Marcinie za wątek prawny. Miejmy nadzieję, że jeszcze przez jakiś czas to my, ludzie, biologiczna inteligencja, będziemy panami sytuacji…
F.: Dzięki również :)!