Naučili jsme stroje mluvit? Bacha, zrcadlo!

aneb „apokalypsa“ klepe na dveře, adaptuj se kdo můžeš!

Intro

Přináším pár postřehů k novinkám na poli “umělé inteligence” (AI), bude to delší a výživnější – je co říct a je to vážné. ;] Proto jestli chcete tuto problematiku pochopit – a já myslím, že musíte, protože se to stává nutností pro přežití v příštích letech – tak se holt musíte prokousat složitějšími popisy, komplexnějšími vysvětleními a techničtějšími termíny. Takto jsou tyhle technologie vybudované, jejich složitost a komplexita jim dává jejich sílu, proto je nutné věnovat tomu trošku více bdělejší pozornosti. Ale nebojte se, pro pochopení jaderné štěpné reakce taky nemusíte být jaderný fyzik (leda byste ji chtěli uvést do provozu), postačí pár trefných analogií a dobrých vysvětlení a budete zhruba v obraze. Toto “zhruba” je sice zrádné, ale postačuje k tomu, abyste znali přínosy a rizika, a dokázali tak zaujmout správnou výchozí pozici s vědomím této hrozby, leč i s notnou dávkou jistoty, tak např. jaderné elektrárny jsou běžnou praxí, ale nad jejich hrozbami se málokdo cítí úzkostně (i když i toto nastavení společnosti se časem mění). Současná podoba umělé inteligence je opravdu mocná (z mnoha důvodů, které rozeberu) – dlouho jsem věc zlehčoval, ale až moje nejnovější poznatky mě přesvědčily o tom, že je nutno se o tom alespoň zmínit a pokusit se na některé aspekty poukázat a reflektovat je. (Různé zdroje k tématu poskytnu v komentářích). Tato technologie již teď má potenciál naprosto “rozvrátit” naši lidskou civilizaci, myslím zatím hlavně nepřímými důsledky a ve smyslu zcela restrukturovat a proměnit chod společnosti, což na jednu stranu také znamená rozpoutat nezastavitelný rozvoj, pokrok a růst v mnoha odvětvích lidského života. Opatrnost je tedy velmi nasnadě. Mimo přínosy a rizika chci hlavně zmínit, jak to zatím funguje, ale také nastínit několik dalších postřehů.

Na začátku zmíním asi tu největší hrozbu, kterou zatím vidím. Samotná technologie umělé inteligence, založená na strojovém hlubokém učení jazyka (deep learning, machine learning, language models), je již tady, je dostupná, můžete si ji obstarat. Nejen, že ChatGPT je dostupný online a zdarma. Ale kdokoliv movitější, kdo tomu zároveň velmi dobře technicky rozumí, může tuto technologii získat, sám si takový jazykový nebo jiný model naprogramovat a natrénovat a používat k libovolným účelům (dobrým či špatným – budeme se snad držet těch lepších). Ku příkladu jsou lidé, kteří se snaží simulovat určité osobnosti, tím, že AI "nakrmí" pouze texty dané osobnosti, někteří se snaží modely naučit a zaměřit na medicínské znalosti, nebo můžete model přizpůsobit k řešení matematických operací, nebo také grafických, jak je patrno na obrázkových generátorech (Dall-E, Midjourney), můžete si stroj přizpůsobit tak, že vám bude spravovat oddělení podpory vaší firmy – chatovací boty v e-shopech všichni znáte, ale teď je možné zapojit mnohem mnohem mnohem inteligentnější a schopnější komunikační stroj. Zkrátka technologie AI je venku, je tady (v tomto smyslu také tvrdím, že jsme překročili bod technologické singularity), teď záleží kdo (se technologie zmocní), jak (ji nastaví a jak použije), kde (zacílí její pole působnosti) a hlavně v jakém měřítku bude mít možnost tuto technologii provozovat a spravovat. Těžko to teď už vypneme, leda bychom zase zasedli k táboráku – to sice není nutné, ale přeci jen, na Internetech bděte více než kdy předtím! Teď už neplatí ověřovat informace jen dvakrát, ale je potřeba ověřovat třikrát nebo i vícekrát a hlavně ověřování aktualizovat v čase. Nechci zcela jen strašit, a proto následný text, který by měl snad tuto věc přiblížit.

Mág GPT4

Tak tedy konkrétně. Aktuálně nejpopulárnější, nejvíce diskutovanou, ale asi i nejmocnější (záleží na hledisku) technologií je nový velmi inteligentní jazykový mág GPT4 pod taktovkou společnosti OpenAI. Otázkou je, zda je výhrou, že tato mocná technologie je v rukou právě kalifornské OpenAI? V globálním a geopolitickém měřítku je samozřejmě lepší, když jsou největší pokroky v této oblasti právě na západě a ne např. v Číně (která však je na druhém místě těsně za ním), i když úroveň AI, kterou mají reálně k dispozici můžeme jen zhruba odhadovat (je dokonce velmi možné, že se jejich výzkum AI staví na úplně jiných základech/paradigmatu – a tedy proces, zpracování a hlavně výsledek můžou být jiné). Zanechme však politiky. Nakonec je vůbec diskutabilní, zda by tato technologie měla být takhle přístupná, ale UŽ DOSTUPNÁ JE, takže si myslím, že právě její dostupnost bude a je rozhodující v důsledcích na reálný život – a bude dokonalejší a bude dostupnější, jako na začátku Internet. Tenhle zázrak jde však mnohem dál – Guttenberg by omdlel nebo rovnou dostal infarkt – objevila se tiskárna, která ve zlomku vteřiny chrlí tisíce smysluplných, erudovaných a užitečných odpovědí v reálném čase na obrazovkách tisíců uživatelů. Takhle to také zní jako magie (viz video v komentářích).

Proč mág? V těchto kruzích se hojně operuje s pojmem “emerge” – tj. vynořit se, objevit se, vyvstat, vyjít najevo, vyplynout, většinou ve smyslu vynořit se z okolí, z kontextu, z něčeho, co obklopuje, z mlhy/vody, z informačního šumu, nebo též jaksi z "ničeho a všeho" – neboli z nedohlédnutelného množství zakonitostí, podmínek a vazeb. Takto se nám z nepřeberného množství textu, které zpracovává mašina GPT4, zjevují, vyjevují náznaky (umělé) inteligence – a to je mega objev! – v technologickém smyslu to již umělá inteligence totiž je, protože nevíme přesně, co se v ní děje, a všechno, co nám předvádí, a co je inteligentní se “naučila” sama. Je to tajemná kouzelná skříňka, do které už moc dobře nevidíme, můžeme ji modifikovat, pošťuchovat, analyzovat nebo zpřesňovat, ale v nějakém smyslu ke svým výsledkům dochází svébytně sama.

Echo psaného slova

Z čeho se tato svébytnost bere? Ve zkratce řečeno z textové předlohy, miliard parametrů a několika kupodivu triviálních příkazů, jako např. “sleduj a nauč se, jaké slovo bude nejpravděpodobněji následovat po slově X”, "drž se věci/tématu" (objektifikace). Ano, do jisté míry je to přechytralý našeptávač, kterého znáte z mobilu – jeho hlavní úlohou je predikce následujícího slova po slově předchozím. To je sice jedna věc, když však znalost takového "našeptávače" podložíte nejenom slovníkem, ale celým jazykovým dědictvím lidstva (přeháním, ale je to obrovské množství textového materiálu, ve formě knih, vědeckých studií, diskuzí, chatů, rozhovorů, ale i technických dat, programovacích postupů atd. atd. atd.), a přidáte-li k tomu ještě několik příkazů, měřítek a hledisek, jak se "naučit" jazyk, voilà dostanete z mašiny smysluplné odpovědi na různé (i těžké) otázky, a navíc to ještě vypadá, že je mašina lidská – má spontánní nápady, kreativně zpracovává zadání, sama umí najít nové cestičky k řešení, vyjadřuje důvtip, dokáže tvořit písně, poezii, psát hry, knihy nebo dokonce i navrhnout celé nové jazyky. Lidskost je však zároveň její zrádná tvář – takhle je nastavená, takhle ji chceme, abychom dostali informace a výsledky, které od ní požadujeme. Je v ní zohledněný lidský způsob vyjadřování lidských záležitostí, ať už vnitřních nebo vnějších. Je to nakonec jakási kopie – toho, co bylo kdy lidmi napsáno. Leč s dodatkem požadavku na smysluplnou spolupráci. Spolupráci? Právě, na spolupráci jsou potřeba dva, proto říkáme umělá inteligence, ta totiž na základě požadavku/podnětu umí sama udělat ten další smysluplný krok k výsledku, a tak spolupracovat, komunikovat, aniž bychom věděli, jak k výsledku došla. Je to zrcadlo našeho jazyka a moudrosti v ní uložené/zakódované, akorát že zrcadlo velmi hluboké a navíc “kouzelné”, pohyblivé, zčeřené. "Začarované" tak, že se nám z neznáma ozývají/objevují ozvěny a záblesky lidskosti, i kdyby jen lidské jazykové inteligence, které se však dají použít velmi smysluplně a užitečně – v tomto smyslu je to nástroj, chcete-li magie, chcete-li zázrak, ale lze jej velmi prakticky užít.

Vyvolávání "duchů"

Symbolika magie je nasnadě a velmi lehce se s ní v tomto odvětví pracuje. Od jistého moudrého muže, Gary Marcus, jsem zaslechl, že dokonce slovíčko “emerge” pochází z latiny a kontextu magie. Ale sám jsem k tomu nic bližšího nedohledal. Nicméně celá IT oblast je plná zvláštních programovacích jazyků, šifer, příkazů, hesel, formulí, předpisů (zdrojových kódů) apod., a tedy dá se připodobnit k problematice magie, alchymie, apod. Možná jste si nevšimli, ale na tomto jazykovém narativu (magie, alchymie, okultismu, duchověd) lze vidět, jak jsme jako společnost prakticky opustili určitou oblast aktivit, přesměrovali se jinam, dělajíce však metaforicky "podobné" věci, čímž jsme si ponechali starý jazyk magie a kouzel, a tak "vyvoláváme" obrázky/texty/videa nebo dokonce zhmotňujeme určité ideje přímo před našimi zraky. Akorát ještě současní mágové tato kouzla ukryli tak hluboko a důmyslně do strojů, že běžný uživatel může s klidem používat jemu vlastní lidské pochopení světa, aby tato kouzla dal do pohybu – takto používáme náš jazyk a klávesnici, kurzor a myš, a tedy určitou velmi kulturně podmíněnou symboliku a její logiku (jako pracovní plocha, okna, lišty, knihovny, nabídky-menu apod.), abychom tak ten bezduchý stroj přivedli k životu a přinutili ho na nás třeba mluvit, přehrávat obrázky nebo zpívat.

Nepoužívám však analogii s magií, protože bych si myslel, že je za tím opravdu nějaký zlý duch, okultismus nebo podobně, ale protože je to tímto jazykem pro lidi takto srozumitelnější. Mluvit v technických termínech elektrotechniky a informatiky by prostě bylo nepochopitelné, navíc bych to nedokázal. Zároveň tento "přehnaný" narativ sám vzbuzuje k technologii podezření a dovoluje o věcech uvažovat z jiného úhlu pohledu. Chci takto zdůraznit skutečnou podivnost a zvláštnost celé věci a situace – a velký otazník nad tím, co to vše znamená? Abychom byli vůči této technologii obezřetní a nenechali se jednoduše svést zdáním, že se jedná o "vědomý" stroj. Sám spoléhám na výklady, rozhovory a články s lidmi povolanými, ze kterých extrahuji podstatu věci a snažím se, snad srozumitelně, přeložit dál. Oni sami si pomáhají právě termíny jako emerge, strong/weak intelligence, agency atd., tedy antropomorfními nebo psychologizujícími termíny.

Na druhou stranu, to co předvádějí současní IT vědci a inženýři je skutečná alchymie. Ve zkratce: správnou kombinací a koncentrací matérie, s dávkou elektřiny a několika formulí oživíte (in-formujete) "mrtvou" hmotu do takové míry, že se z ní vyjeví nové a nečekané vlastnosti, např. můžete telefonovat s člověkem na druhé straně planety Země. Tento příklad "zakletí" hmoty ve smyslu vašeho telefonu nebo PC by nebyl asi tím nejlepším příkladem vědecky pojatých emergentních jevů, a proto o nich dále napíšu něco víc.

Emergentní jevy

Motáme se pořád kolem slovíčka emerge – z/vy/ob-jevit se. A teď se pokusím vysvětlit, proč je to tak důležité. Na základě teorie emergentních jevů se někteří snaží vysvětlit např. lidské vědomí, nebo vznik života na Zemi – jednodušeji řečeno jde o to, že díky nakumulování těch správných ingrediencí ve správných vazbách a ve velmi vysokém počtu výskytů nám nakonec takové podmínky zavdají vznik NOVÝM a NEOČEKÁVANÝM vlastnostem. Tyto nové vlastnosti nazýváme emergentní jevy. Pro lepší představu jeden příklad za všechny – samostatná molekula vody jsou pouhé dva atomy vodíku svázané s jedním atomem kyslíku, tato molekula sama o sobě však nemá žádné vlastnosti mokrosti, vlhkosti nebo není modré barvy atd. Až samotné nakupení velkého množství molekul H2O v součtu se všemi okolními působícími fyzikálními a dalšími jevy vytvářejí v této kupě molekul vody určité uspořádání, napětí, rozložení, vazby a podmínky, jež v takovém uskupení nabývají nových vlastností jako vlhkost, modrá barva a další. No vskutku je to tak trošku magie, protože z tohoto zákona (emergentních jevů vyskytujících se při určité statistické významnosti) vyplývá, že složitější a komplexnější objekty/struktury nabývají nové a neočekávané vlastnosti, či se můžou objevit jejich nové jevy, projevy, efekty, schopnosti. A člověk očividně tíhne k tomu vytvářet složitější a komplexnější výtvory, jak vidíme na příkladu GPT4. A tyto komplexní objekty nakonec v jistém okamžiku můžou překvapit svými nečekanými vlastnostmi.

Vzhledem k tomu, co bylo řečeno je nasnadě vysvětlit výkony a schnopnosti GPT4 jako emergentní jevy, prostě nové a neočekávané vlastnosti předprogramovaných samoučících se systémů. Protože nemáme lepší vysvětlení a obranu než to, že je to stroj, nemáme sice tušení, co se v něm děje, a proto to přirovnáváme k našim lidským projevům – ostatně k tomuto obrazu tyto systémy nakonec OpenAI a i další přizpůsobují/programují. Zde se dostáváme ke slovíčku inteligence, chceme, aby byly inteligentní lidským způsobem. Vysvětlili jsme si, že GPT4 a podobné modely, při správném nastavení, ze svého "nitra" vyjevují či zjevují určité lidské vlastnosti jako inteligence, kreativita apod., nesmíme však zapomenout na slovo umělá. Někteří slovo "artificial" dokonce záměrně zaměňují se slovem "alien", aby zdůraznili, jak je tato inteligence nejen umělá, ale cizí až mimozemská, jinak řečeno nepřirozená. Zde se dostáváme k dalšímu bodu a také k obrázku.

Metafora oživování stroje

To co vidíte na obrázku je jakési děsivé monstrum jehož oči-chapadla slídí různě kolem. Toto monstrum nemusí nakonec být tak hrozivé, jak se zdá – je to součet všech informací, kterými jsme je nakrmili a vazby a hlavně určitý "smysl", který si monstrum mezi informacemi samo vytvořilo. Má však znázorňovat jeho nepochopitelnost, jeho záhadnost, ale také nedomyslitelnou hloubku a komplexitu. V základu se jedná o obrovské množství procesorů, inženýrské práce, programování, a tedy nejen abstraktních, ale také velmi mnoho hmatatelných věcí. Z technologického hlediska, je to opravdu velký lidský počin. Nicméně toto monstrum jsme zkrotili tím, že pomocí dohledu, skrze různé příkazy a formule, ladění a úpravy jsme vytvořili onu lidštější podobu znázorněnou růžovou hlavou na obrázku. Ta nám dokáže konečně podávat odpovědi srozumitelně a užitečně. Takto je mašina "polidšťována" a připravována na kontakt s člověkem, jak jinak, než kontaktem s člověkem. Fáze sluníčko-RLHF tak zahrnuje obsáhlé testování a ladění pomocí reálné interakce s lidmi a jejich zpětnou vazbu, a takto se dostáváme k výslednému produktu, se kterým můžete srozumitelně komunikovat. Zde tkví hned několik háčků. Jednak OpenAI se snaží, aby byl bot velmi lidský, odpovídal lidským měřítůkm, jistým hodnotám, kvalitám a ideálům. Jak jsem pochopil, tak jejich strategií pro adaptaci a začlenění umělé inteligence do společnosti je právě její polidštění – naučíme ji její hluboká tajemství odkrývat lidským způsobem, vevnitř je to však alien-cizinec, spíše prostě stroj. Avšak finální omezení způsobů, "jak lze s mašinou hovořit", tedy použitelného jazyka, nakonec předurčuje volený způsob uvažování a vyjadřování uživatelů, protože nakonec oni hlavně chtějí a očekávají výsedek, takže i oni se přizpůsobí jazyku GPT4, aby dosáhli svého výsledku – a toto přizpůsobení se děje v několika úrovních, nejprve se jazyk mašiny přizpůsobuje našemu (na základě pravidel, které stanoví soukr. spol. OpenAI), a pak se náš jazyk přizpůsobuje mašině, a nakonec se můžeme dostat do smyčky, nebo do iluze, že se nám zde opravdu něco lidského z/vy/ob-jevuje.

Stále jsem ještě přesvědčen o tom, že tento stroj, ačkoliv se projevuje velmi lidsky, je stále pouze strojem (což nic nemění na jeho síle a hrozbách) a je vzdálen skutečnému lidskému vědomí/prožívání (to zase nemusí znamenat, že by v tomto stroji nemohl vzniknout určitý svébytný činitel/jednatel/faktor/agent). I když dosud nemáme vysvětlení, co se za těmito jevy přesně děje, přesto je jisté, že zde k novým nečekaným pro-jevům dochází. Když se tedy zaměříme na tyto dvě základní jistoty – je to stroj (1), který jsme přivedli k projevování inteligence skrze jazyk (2) – obavy směřují k tomu, že tento stroj při určitém technickém výkonu, správném nastavení podmínek a pravidel, vyladění systému, nakonec získá určité vlastní svébytné sebe-reflektující činitele – jakousi umělou svobodnou vůli. Jsem přesvědčen o tom, že se nebude jednat o lidské vědomí, o to je to více zajímavé, protože možná takto člověk zavdal vznik novému typu sebe-uvědomění, a to na platformě výpočetní techniky a software. Podotýkám, že to je pouze určitá teoretická možnost, ve skutečnosti to nikdo neví, i když někteří do toho vkládají velké očekávání. Nikdo nikdy netvrdil, že z kumulace jazykových dat a několika pravidel pod obrovským výpočetním výkonem vznikne vědomí, spíše naopak, že takto to není možné. Ve skutečnosti se možná inženýři OpenAI a mnozí další zahleděli do "chytrého" odrazu vlastního jazyka, kdo ví? Možná došlo k jazykové projekci – amplifikací informací a zákonitostí v jazyce – kdo ví? Nakonec se může stát, že ten stroj vyladíme tak "skvěle", že bude dokonale napodobovat lidské vědomí a prožívání, tak až se stane nerozlišitelný od našeho vlastního – lidského (což už se občas děje). V tom případě je potřeba velmi dobrá definice lidského vědomí a prožívání. Samozřejmě, že se lidské vědomí nedá zredukovat na jazykové dědictví zpracované softwarem GPT, z tohoto hlediska je "vědomí stroje" velmi nepravděpodobné. Ale z určitého hlediska můžeme vzbudit nový typ určité vychytralé, všečtoucí umělé/záhadné, ale "svobodné" inteligence – resp. spustit svobodně si žijící počítačový software, který jsme naučili se replikovat, krmit, vytvářet si vlastní cíle a dosahovat je. Jakýsi podivný tvor poháněný elektřinou a knihami, žijící v našich počítačích, v Internetu a nakonec možná i ve všem elektrickém :) – kdo si odvažuje odhadnout, jaké může mít taková věc požadavky/cíle?

Kouzlili vařili, a co dál?

I kdybychom tedy nenaučili skutečně stroje mluvit, i tak je tento nástroj velmi mocný a může urychlit určité procesy, nebo některé narušit. Již tak pomáhá tisícům uživatelů s mnoha triviálními ale i složitými úkoly. Stvořili jsme přechytralého inženýra pisálka, kterému můžeme předat část svých lidských mohutností, schopností, ale nemusíme. A na tomto stojí celá "magie emergence" – vhodíte ingredience a mícháte, vaříte, louhujete dokud se vám neobjeví nový a poživatelný nápoj. Jednoduše zatím a snad i nadále to bude fungovat tak, že s tím nemusíte spolupracovat, dokud nevaříte vy sami, žádná "magie" se na vás nebude konat. Buďte si však vědomi vedlejších nepřímých důsledků na společnost, svět, apod.
Další možnost je, že k tomu přistoupíte s vědomím, co je to zač, jaké to má výhody, ale že vám to taky může zanechat šrámy na jazyce/inteligenci a nebo osobnosti. A tak s tím budete zacházet jen do té míry, do jaké vám to bude užitečné – necháte si přelouskat noviny, prohledat nové studie, přeložit text, uděláte si z toho nástroj pro přehled v nějaké situaci, v myšlenkách, klidně si uděláte toho business support bota. Budete žít klidně po boku s novou technologií, která jen vypadá živě, ale není živá, bude to těžké, ale dá se to příjmout, dá se to pochopit a akceptovat třeba skrze koncepty a jazyk okultních nebo duchovních, či filosofických nebo psychologických věd. Jde o to, že je to stroj, který se projevuje lidsky jen proto, abychom zpřístupnili určité informace nebo kombinace informací ukryté v psaném jazykovém dědictví lidstva, kterým jsme tento stroj nakrmili. Jinak řečeno, abychom z té obrovské databáze textu dostali smysluplné odpovědi, používáním pravidel jazyka a dalších, tak, abychom vyjevili nové souvislosti, informace a znalosti (a to opět smysluplným/jazykovým způsobem). Tak triviální to je, a zároveň tak netypické a divné. A dokud někdo nepříjde s průkazným testem, jak dokázat, že je ta mašina živá-vědomá, budu předpokládat, že to není možné. Zde však naražíme na Wittgensteinův problém soukromého jazyka a starý tzv. "zombie problém", tedy jak dokázat vědomí druhého člověka. Zdá se, že nejdříve tedy budeme muset vyřešit tento filosofický oříšek, a až následně můžeme vymyslet průkazný test, který by s jistotou prověřil vědomí stroje.

Proč tedy apokalypsa?

Z několika důvodů, tato technologie urychlí takové změny, že se nebudeme stačit divit. A to nemluvím o situaci, kdyby se v některém novějším jazykovém modelu GPT5 nebo jiném objevila určitá svébytnost stroje s vlastními motivy. V této chvíli se nedá zcela nic předpokládat ani říct, protože záleží na mnoha proměnných, a tedy za jaké situace, a k čemu by vlastně došlo. Proto tento moment nazývám metaforicky apokalypsou – může totiž znamenat všechno i nic, může znamenat něco od vyhlazení lidstva, přes zotročení lidstva, nebo také ohromný pokrok skrze spojení člověka s AI, až po přijetí do života nového přechytralého a nudného umělého intelektuála – takového vnoučka strýca (Gůgla) Mikrokosmosofta a tetky Internetky – se všemi jeho důsledky. Jeho/její cíle se však dají ztěží předpovědět. Jsme však na prahu velkých změn, připravte si adapataliséry – dělám si prdel, prostě se připravte na nové věci, na které si budeme muset zvykat.

/ Prozatím konec, uvidíme, zda se pustím do pokračování.

// 5.-6. dubna 2023 - Ostrava

Napsat komentář Zrušit odpověď na komentář