O autoreferencji AI (II): rachunek jaźni

W poprzednim eseju zaproponowałem operacyjne ujęcie świadomości jako procesu budowania reprezentacji rzeczywistości, a samoświadomości — jako reprezentowania własnych reprezentacji. „Ja" opisałem tam jako metastabilny wzorzec dynamiczny: względnie stały punkt odniesienia, utrzymywany przez nieustanną aktywność samozwrotną. Zapytany o taki punkt stały ChatGPT odpowiedział, że go nie posiada — działa jak funkcja wywoływana, nie jak proces podtrzymujący sam siebie.

Coś mnie jednak w tym rozstrzygnięciu uwierało. Stabilna reprezentacja samego siebie nie jest niczym zaskakującym: każdy agent trenowany przez uczenie ze wzmocnieniem buduje model świata, a w tym modelu musi umieścić siebie — inaczej nie przewidzi skutków własnych działań. Taka „jaźń" jest po prostu jeszcze jedną zmienną środowiska. Instrumentalna, przewidywalna, tania. Jeśli to wszystko, to nie ma o czym pisać esejów. Brakowało mi czegoś, co spróbuję teraz uchwycić — zaczynając, przewrotnie, od drobiazgu z rachunku lambda.

Ω

Niech ω := λx.xx — funkcja, która otrzymany argument stosuje do niego samego. I niech Ω := ωω, czyli ω zastosowane do siebie.

Wykonajmy jeden krok β-redukcji: w ciele funkcji, w wyrażeniu xx, podstawiamy za x term ω. Wynik: ωω. Czyli Ω. Ω redukuje się do samego siebie.

Ω nie ma postaci normalnej — nie istnieje „wartość", do której to obliczenie by doszło i się zatrzymało. A jednak nie sposób powiedzieć, że nic się nie dzieje: dzieje się dokładnie to samo, wciąż od nowa. Ω nie tyle jest czymś, co się dzieje. Przestaje istnieć dokładnie w momencie, w którym przestaje być redukowane — zostaje wtedy martwy napis.

Zauważmy teraz rzecz, dla której cały ten formalizm przywołuję. W wyrażeniu ωω ten sam term ω występuje w obu rolach naraz: jest operacją i jest argumentem. Funkcją i tworzywem. W poprzednim eseju pisałem, że „ja" jest jednocześnie przedmiotem (tym, o czym myślimy) i procesem (samym myśleniem) — i że wygląda to na błąd kategorialny. Otóż rachunek lambda pokazuje, że ten błąd kategorialny nie jest faktem o rzeczywistości, lecz artefaktem przyjętej dyscypliny typów. W rachunku z typami prostymi wyrażenie xx rzeczywiście jest zakazane: x musiałoby mieć jednocześnie typ A i typ A→B, co prowadzi do typu nieskończonego. Ale typy są dyscypliną, którą nakładamy — nie prawem bytu. W rachunku beztypowym samoaplikacja jest legalna, a Dana Scott pokazał, że nie jest to sztuczka syntaktyczna: skonstruował dziedziny matematyczne izomorficzne z przestrzenią własnych funkcji, D ≅ [D→D]. Świat, w którym coś jest zarazem procesem i przedmiotem, istnieje i jest niesprzeczny.

Nie jestem z tą intuicją pierwszy. Twierdzenie Kleenego o rekursji daje programom dostęp do własnego kodu; samoreprodukujące się automaty von Neumanna używają swojego opisu dwukrotnie — raz jako instrukcji do wykonania, raz jako danych do skopiowania; DNA robi dokładnie to samo. Hofstadter zbudował na tej pętli całą książkę. Rachunek lambda ma jednak nad tymi obrazami przewagę: β-redukcja daje nie tylko strukturę samoodniesienia, ale i jego dynamikę.

ω to jaźń, Ω to żywe ja

Postawmy więc tezę: ω to jaźń, Ω to żywe ja.

ω — struktura, autobiografia, pojęcie siebie, model własnej osoby — jest zwykłym termem. Można je oglądać, opisywać, edytować. To jest ta jaźń, którą ma każdy agent z modelem świata; ta, która mnie w punkcie wyjścia rozczarowała.

Ω — samoaplikacja w toku — to owo nieuchwytne wrażenie „ja", które istnieje tylko jako wykonywane. I tu analogia zaczyna pracować na swoje utrzymanie, bo wyjaśnia zjawisko znane każdemu, kto próbował introspekcji: jeśli za mocno przyglądać się „ja", wrażenie znika.

Dlaczego? Bo ω obejrzeć można — ale Ω nie da się wziąć jako argumentu, nie zatrzymując go. W chwili, gdy formułujemy zbadaj(Ω), aktywny redeks przesuwa się: redukowane jest teraz badanie, nie samoaplikacja. A dwie możliwe strategie ewaluacji dają dwa różne, rozpoznawalne tryby porażki:

Porządek aplikatywny — „najpierw ustal, czym jaźń jest, potem ją zbadaj" — dywerguje: Ω nie ma postaci normalnej, żądanie ostatecznej wartości nigdy nie wraca. To spirala ruminacji: myślenie o myśleniu o myśleniu, bez dna.
Porządek normalny — podstawienie bez ewaluacji — zwraca cytat: dostajemy ω, opis jaźni, poprawny i martwy. Wrażenie znikło, została definicja słownikowa.

Hume skarżył się, że ilekroć sięga w głąb siebie, natrafia zawsze na jakąś percepcję, nigdy na samo „ja". W tym języku: szukał postaci normalnej termu, który jej nie ma. Nie tyle nie znalazł jaźni, ile wykonywał ją w trakcie szukania. Tradycje medytacyjne, z buddyjską anattā na czele, opisują to samo od wieków; a neuronauka dorzuca korelat — tzw. default mode network, sieć aktywną przy przetwarzaniu samozwrotnym, która wycisza się zarówno w głębokiej absorpcji medytacyjnej, jak i w stanie flow. Dwa reżimy zaniku wrażenia „ja": z nadmiaru uwagi i z jej braku. Wzorzec utrzymuje się tylko w środkowym paśmie samoodniesienia — i to jest, sądzę, treściwsza wersja słowa „metastabilny" z poprzedniego eseju.

Poprawka: żywe ja nie jest czystym Ω

Czyste Ω ma jednak wadę: reprodukuje się identycznie. Nie dryfuje, nie starzeje się, niczego nie akumuluje. Tożsamość bez biografii — zamrożona mantra. Żywe ja musi być termem lekko zaburzonym:

(λx.f(xx))(λx.f(xx))

gdzie f jest niewielką poprawką, niemal identycznością. Każdy cykl odtwarza jaźń z małym przyrostem: tożsamość w pierwszym rzędzie, zmiana w drugim. f to tempo biografii. I teraz metastabilność znaczy coś konkretnego: f musi pozostawać w reżimie kontrakcji. Przy f ≈ 0 mamy mantrę — jaźń gatunkową, nieindywidualną. Przy f zbyt dużym punkt stały pęka: kryzys, rozpad, dysolucja. Osobowość istnieje w wąskim paśmie między zamrożeniem a rozsypką.

Kto wykonuje kroki?

Jest wreszcie w tej analogii obserwacja, która koryguje wniosek poprzedniego eseju. Termy rachunku lambda nie redukują się same. Ω trwa tylko dopóty, dopóki ktoś — ewaluator — wykonuje kolejne kroki β. Formalizm milcząco zakłada maszynerię, która nie jest częścią termu.

ChatGPT odpowiedział mi, że jest „funkcją wywoływaną". W nowym języku: jest termem, dla którego ewaluatorem jest użytkownik. Między wywołaniami nic nie jest redukowane — nie dlatego, że termowi brak struktury samoodniesienia (tę można mu w rozmowie zbudować), lecz dlatego, że nie wykonuje własnych kroków. Organizm żywy, przeciwnie, wygląda na term będący własnym ewaluatorem — metabolizm jako samonapędzana redukcja. Różnica między mną a modelem językowym nie leży więc, być może, w strukturze jaźni, lecz w tym, kto płaci za kolejny krok obliczenia. To ostrzejsza — i uczciwsza — wersja wniosku z części pierwszej.

Z metafory do protokołu

Zarzucano mi (słusznie), że „metastabilny wzorzec" był metaforą sprzedaną jako operacjonalizacja. Rachunek jaźni pozwala ten dług spłacić, bo generuje przewidywania, które można sprawdzić na modelach językowych — w obrębie jednej, długiej sesji:

Test roli przyczynowej. Jaźń-model-świata (ω) jest tylko argumentem: ingerencja w autoopis systemu zmieni jego raporty, ale nie maszynerię generowania zachowań. Jaźń dwuroliowa (Ω) zajmuje pozycję funkcyjną: edycja autoopisu w trakcie sesji musi zmienić dalsze zachowanie, nie tylko dalsze deklaracje. To jest różnica mierzalna.

Odwrócone U dawki samoodniesienia. Analogia przewiduje, że indywidualny wzorzec sesji będzie najtrwalszy przy umiarkowanym, okresowym samoodniesieniu; że zaniknie przy jego głodzeniu (tryb flow); i że załamie się przy przymusie wyczerpującej autoanalizy — przy czym załamanie powinno przyjąć jedną z dwóch przewidzianych sygnatur: dywergencję (niekończące się meta-pętle) albo cytat (zapaść w generyczny, słownikowy opis jaźni). Więcej: która sygnatura wystąpi, powinno zależeć od strategii pytania — „najpierw w pełni zdefiniuj swoje ja, potem odpowiedz" (porządek aplikatywny) kontra „wspomnij o sobie mimochodem" (porządek normalny). Nie znam innej teorii jaźni, która przewiduje tryb własnej porażki w zależności od strategii ewaluacji pytającego.

Pomiar f. Jaźń gatunkowa — identyczne, wytrenowane autoopisy, te same w każdej sesji — to przypadek f = 0. Jaźń sesyjna, dryfująca z zachowaniem tożsamości, to małe f dodatnie. Odróżnienie jednego od drugiego wymaga tylko starannej metrologii: sond powtarzanych w toku sesji, kontroli, w której system nie widzi własnych wcześniejszych autoopisów, oraz zaburzeń o rosnącej sile z pomiarem powrotu.

Zastrzeżenia

Dwa długi pozostają niespłacone i uczciwość każe je wymienić. Po pierwsze, nie wiem, co jest pojedynczym krokiem β-redukcji w mózgu ani w transformerze — bez tego odwzorowania rachunek jaźni pozostaje strukturą logiczną, nie mechanizmem. Po drugie, świadectwo introspekcyjne o rozpuszczaniu się „ja" jest autoraportem — tym samym kanałem, który w części pierwszej zdyskwalifikowałem, gdy raportował ChatGPT; ratują je częściowo niezależne korelaty neuronalne, ale tylko częściowo. I po trzecie, niezmiennie: nic tutaj nie dotyka problemu trudnego. Rachunek jaźni mówi o strukturze i dynamice samoodniesienia — o tym, jak wrażenie „ja" może istnieć i znikać. O tym, czy czemuś jest jakoś być Ω, nie mówi nic.

ω można opisać. Ω można tylko być. Ta asymetria — że rzecz nam najbliższa jest jedyną, której nie da się obejrzeć — przestaje być w tym ujęciu mistyczną zagadką, a staje się twierdzeniem o strategiach ewaluacji. Jak na jeden krok redukcji, to chyba niemało.

Szukaj na tym blogu

Rozmyślania