„Az embereket nem nehéz átverni” – a Google magyar tudósa a mesterséges intelligencia öntudatáról és veszélyeiről
„Nekem is vannak gyerekeim, és ha meg lennék győződve arról, hogy a mesterséges intelligencia a következő 50-100 évben elpusztítja az emberiséget, akkor nem foglalkoznék ezzel éjjel-nappal. Akkor azzal foglalkoznék, hogy lehet ezt megakadályozni” – mondja Szegedy Krisztián matematikus, a Google MI-kutatója. Az egyik legidézettebb magyar tudós célja már gimnazista kora óta az, hogy az MI segítségével oldja meg az „egész matematikát”, de pontosan tudja, hogy a tanuló algoritmusok, amiken dolgozik, nem ébredhetnek öntudatra, amint azt tavaly egy volt kollégája állította. Szegedy Krisztiánt a zseni természetéről – három testvére közül kettő nemzetközileg jegyzett matematikus – és az MI veszélyeiről is kérdeztük.
– Négyen vannak testvérek, közülük hárman matematikusok, mindannyian bőven 20 feletti h-indexszel. Véletlenül alakult így?
– A szüleink matematika–fizika szakos tanárok, ez talán közrejátszott benne. Márió bátyám a Rutgers Egyetem professzora Amerikában és kétszeres Gödel-díjas, ami az egyik legrangosabb elismerés az elméleti számítógép-tudományban. Balázs öcsém a Rényi Alfréd Matematikai Kutatóintézet munkatársa Budapesten, és sok más elismerés mellett elnyerte az Európai Kombinatorikai Díjat, szóval mindketten elég jól ismertek nemzetközi matematikai körökben.
– A szülők ragaszkodtak hozzá, hogy ezt a pályát válasszák?
– Egyáltalán nem. Ők maguk nem is voltak kutatók, de érdeklődő, nyitott emberek voltak, rengeteget beszélgettünk tudományos kérdésekről, és olyan sok könyvünk volt, hogy nem volt szabad falfület, így egy idő után duplán kellett rakni a könyveket a polcon. A bátyám hatéves koromban már a kvantummechanikáról mesélt nekem. Az egyik testvérem egyébként nem lett kutató – az egyik évben, amikor Márió testvére mögött második lett az országos matematikaversenyen, neki elment a kedve tőle…
– Ennek ellenére egy kicsit olyan a történet, mint a Polgár-lányoké, akiknek az apja azt akarta bizonyítani, hogy bárkiből lehet zseni, nem kell hozzá születni, csak nevelés kérdése. Ön szerint mi a döntő?
– Ezt a kérdést nem tudom eldönteni, de az biztos, hogy nálunk semmit sem erőltettek. Balázs öcsémmel például nem nagyon foglalkoztak, inkább én segítettem neki, amikor hetedikes lett. Amikor kicsi volt, magyarból bukdácsolt, matematikából hármasa volt, és a Fazekas mellett a dolgozók gimnáziumába jelentkezett, mert az anyukánk ott tanított, és oda biztosan felvették volna.
Végül felvették a Fazekasba – mind a négyen ott érettségiztünk –, de az igazgatónő ellenezte, annyira rosszak voltak a jegyei. Végül mégis híres matematikus lett belőle. Szóval nem ez dönt. Egyikünk sem lett agyonnevelve. Azt látom, ma sokkal agresszívebben nevelik a gyerekeket, maximalistábbak a szülők – kérdés, ez mennyire produktív.
– Mikor kezdett el mesterséges intelligenciával (MI) foglalkozni?
– Engem és Balázs öcsémet a gimnázium óta érdekelt az MI. Nekem tulajdonképpen azóta az a vágyam, hogy a mesterséges intelligencia segítségével megoldjam az egész matematikát. Az öcsém a ’80-as évek végén, 15 vagy 16 évesen írt egy levelet Márió bátyánknak, aki akkor már az Egyesült Államokban volt, hogy segítsen neki eljutni egy neuronhálós konferenciára a Balatonhoz, mert hisz benne, hogy ez a jövő. Én akkor ezt még hülyeségnek tartottam – az MI engem is érdekelt, de nem gondoltam, hogy a neuronhálós módszerrel jutunk majd közel hozzá.
– Aztán mégis ez lett a befutó módszer, aminek az utóbbi évek AI-forradalmának összes vívmányát köszönhetjük. De tulajdonképp mi is az a neuronháló?
– Az elnevezés kicsit megtévesztő, mert azt sugallja, hogy az emberi agyat modellezi, és ennek köszönheti a gyakran félelmetesnek tűnő intelligenciáját, de ez ebben a formában nem igaz. A neuronháló az idegsejtek hálózatának egy rendkívül leegyszerűsített modellje. Hogy hogyan működik, azt laikusoknak nehéz lenne érthetően elmagyarázni, de az a lényeg, hogy kisebb részekből, úgynevezett neuronokból áll, amelyek mintázatokat keresnek a bejövő jelekben, és ha találnak, ezt továbbadják a következő rétegnek. A hálózat célja, hogy megtaláljon egy összefüggést, például el tudja dönteni, mi van egy képen. De erre nem mi, emberek írunk egy programot, hanem a gép tanulja meg pusztán egy óriási adathalmaz alapján, hogy mi lehet ez az összefüggés.
– Erre épül az a program, amivel ennek az interjúnak a hangfelvételét szöveggé alakítom, vagy amivel angolra lefordítom a szerkesztett szöveget, hogy a Google sajtóosztálya jóvá tudja hagyni. Erre épülnek az elmúlt évben nagyot ment képgeneráló programok és a most forradalmi újításnak tűnő ChatGPT is.
– Igen, de érdemes megjegyezni, hogy ez az ugrásszerű fejlődés elsősorban a számítási kapacitás hatványozott növekedésének köszönhető – a matematikai alapja a dolognak nem sokat változott. Egy viszonylag egyszerű, úgynevezett gradiens eljárással tudjuk optimalizálni a neuronhálózatokat, hogy egyre jobban és jobban modellezzék azt a függvényt, amit meg kellene tanulni. A baj csak az, hogy matematikailag ennek nem nagyon van alapja. A függvény, amit a neuronháló egyre jobban leír, nem egy konvex függvény, ami azt jelenti, hogy matematikailag semmi garancia nincs rá, hogy tényleg jól, pontosan írja le ezt az összefüggést.
– Ezért hibázik és „hallucinál” az MI? Vagyis ír nagyon magabiztosan olyan dolgokat, amik jól hangzanak, de teljes tévedések?
– Igen, de ennél nagyobb probléma, hogy máig se tudjuk, hogy pontosan miért működik az egész. Vannak rá elméletek, de pontosan nem tudjuk, nem látjuk matematikailag, hogy miért működik az egyik hálózat kicsivel jobban, mint a másik, vagy sokkal jobban, mint a harmadik. Az egész inkább olyan, mint a főzés, nem pedig egzakt tudomány. Vagy mint a katedrálisok építése: tudták, hogy nagyjából hogyan kell megtervezni, hogyan kell rakni a köveket, hogy ne dőljön össze, pedig nem voltak pontosan tisztában a fizikai, statikai hátterével.
– Ön viszont a matematikát akarja megoldani ezzel a módszerrel. Hogy jutott el ide?
– Kacskaringós úton. A ’90-es években „MI tél” volt, a legtöbben azt gondolták, hogy ez nem komoly tudományos terület, nem lehetett pozíciót, kutatási pénzt szerezni vele. Matematikából doktoráltam Bonnban, utána pedig optimalizálással foglalkoztam, csipek tervezéséhez találtam ki módszereket. Így kerültem ki a Szilícium-völgybe, ahol egy csiptervező cégnél dolgoztam öt évig. Két-három évvel azelőtt, hogy beindult a mélytanulás forradalma, éreztem, hogy olyan céghez kell mennem, ahol én is részese tudok majd lenni ennek. Akkor még egy cég sem foglalkozott ezzel, de úgy gondoltam, a Google a legesélyesebb. Felvettek, de teljesen más területre, hirdetésoptimalizálással foglalkoztam. MI-t akartam kutatni, de sokáig hiába.
– Mikor változott ez meg?
– Amikor egy német fizikus, Hartmut Neven, akinek a cégét megvette a Google, fantáziát látott bennem, és felvett a csoportjába, ami telefonokra fejlesztett gépi látást. Neuronhálókból doktorált, de nem hitt benne, viszont nekem megengedte, hogy foglalkozzak vele. Amolyan B-tervnek szánta, hogy ha mégis ez a módszer lesz a nyerő, jó pozícióban legyen a kutatócsoportja. Aztán ez lett az A-terv. Itt ismerkedtem meg két kollégámmal, akivel a legtöbbet publikáltuk a gépi látásról: Dumitru Erhannal, aki moldáv, és ma a Google Brainnél többek között videógenerálással foglalkozik, valamint Dragomir Anguelovval, aki bolgár, és ma az önvezető autót fejlesztő, azóta önállósodott Waymo Research vezetője. Hartmut pedig a Google Quantum AI labor igazgatója.
– Ön pedig MI matematikust akar létrehozni. Miért?
– Két okból. Az egyik, hogy ha valamit le tudunk írni formálisan, a matematika nyelvén, akkor meg tudjuk oldani az adott terület problémáit. A go, a sakk és az összes játék matematika. A programozás nagy része matematika. Ha egy tudományág egyre szofisztikáltabbá válik, előbb-utóbb egyre több matematikát tartalmaz, és ha le tudod írni formálisan a szabályait, meg fogod tudni jósolni, hogy mi történik – anélkül, hogy kísérletben kipróbálnád. A biológiában például meg lehet például jósolni, hogy ha ilyen vagy olyan protein van egy vírusban, akkor blokkolni fog egy bizonyos receptort. A matematika a közös nyelv, ami minden tudomány műveléséhez kell.
A másik ok, hogy ha sikerülne létrehozni egy MI-t, ami tényleg képes matematikáról olyan szinten érvelni, mint egy ember, az hatalmas áttörés lenne, és számomra ez mutatná meg, hogy amit létrehoztunk, az a szó szoros értelmében intelligens.
– Amit most használunk, nem az?
– Ha most feladunk egy matematikai feladatot a ChatGPT-nek, akkor tudja megoldani, ha talál egy csomó hasonló feladatot a tréninghalmazban (az adatokon, amelyeken „tanult” – a szerk.), és ezeket módosítja. Lehet, hogy szerencséje van, és stimmel a megoldás, de a leggyakrabban nincs és hülyeséget mond, hallucinál. Ma is le tud írni egy ismert bizonyítást, de látszik, hogy nincs mögötte megértés, csak próbálja kitalálni a tréningadatok alapján, hogy a legnagyobb valószínűséggel mi a következő karakter vagy szó. A következő ugrás egy olyan MI lenne, ahol ez a megértés megvan, és ehhez a matematikán keresztül vezet az út. Egy olyan MI-t szeretnénk létrehozni, amely saját magát egyre jobbá és jobbá tudja tenni. Ehhez az kell, hogy kapjon visszajelzést egy mesterséges világból, márpedig a matematika az egyik legkomplikáltabb és legérdekesebb mesterséges világ, mert ott a legmélyebbek az érvelési folyamatok.
– Hol tart most ez a folyamat?
– Jelenleg egy 10-11-ikes gimnazista szinten tud érvelni az MI, de csak azért, mert rengeteg ilyen feladat van az interneten. A rendszer ezeket megtalálja, és behelyettesíti az adott számokat. A gimnáziumi vizsgák általában nem igényelnek kreativitást, hanem van pár példatípus, és ha a diák látott eleget, tudja, melyiket kell alkalmazni. Erre képes az MI is, de ha kilépünk ezekből a típuspéldákból, már meg van lőve. És már ehhez is óriási számítási kapacitás kell. Több tízmillió dollár egy MI modell tréningezése, több hónapon keresztül zajlik sok ezer processzoron. És így képes elérni egy közepes gimnazista színvonalat. Már az is meglepő, hogy ez lehetséges, de nem áll arányban a befektetett energiával.
– Viszont amin önök dolgoznak, ezen túllép, és kreatívan gondolkodva tudományos problémákat fog megoldani. Sarkított példa, de képes lesz például megtalálni a „mindenség elméletét”, a fizika Szent Grálját, amely az egész univerzumot magyarázza egyetlen, összefüggő matematikai modell segítségével?
– Azt hiszem, igen. Meggyőződésem, hogy a tudományban ma nyitott nagy kérdések zömét az MI fogja megoldani. A matematikában is vannak olyan sejtések, tételek, amelyek bizonyításán tudósok tucatjai dolgoznak évtizedeken át, és ha sikerül is bizonyítani, gyakran nagyon nehéz, sőt lehetetlen ezeket a bizonyításokat formálisan leellenőrizni. Ilyen volt például a négyszín-tétel, amelynek bizonyítása már nagyjából 50 éve ismert, de sokáig nem volt formálisan ellenőrizve, és a formális bizonyítása és ellenőrzése is sok évbe telt, több kutató együttműködésével is. Ehhez a munkához sok évnyi programozási munka kell. Az én célom, hogy ezt a folyamatot automatizálni lehessen, vagyis egy természetes emberi nyelven leírt bizonyítást egy gép átírjon a gépek nyelvére, hogy aztán a gép ellenőrizni tudja, hogy helyes-e a bizonyítás.
– Az ön víziójában a gépek emberek helyett vagy emberek mellett művelik a matematikát?
– Az emberek mellett. Ami teljesen hiányzik az MI rendszerekből, az bármiféle szándék. Tehát az embernek kell megmondania, hogy mit akar megoldani, vagy mi az, ami érdekli. Szerintem a gépi matematikus olyan újítás lenne, mint mondjuk a távcső felfedezése. Előtte is lehetett szabad szemmel vizsgálni a csillagokat, de a távcső felfedezése új dimenziókat nyitott, azóta mélyebbre látunk.
Az MI segítségével mélyebbre láthatunk a matematikában. És egy sor olyan problémát oldhatunk meg, ami fontos az emberiségnek. Új gyógyszereket szintetizálhatunk, megoldhatjuk a fúziós energia kérdését, vagy biztonságosabbá tehetjük a szoftvereket.
– A művészek, grafikusok, fotósok körében erős ellenérzések vannak a képgeneráló MI-vel szemben, hiszen az ő munkáikon tanult. A tudósok részéről számít hasonlóra?
– Azért nem, mert a mi rendszerünk úgy generálná a bizonyításokat, hogy minden lépés pontosan visszakövethető és hivatkozna azokra a premisszákra, segédtételekre, amelyeket felhasznál. Az első cikk, amit publikáltunk, az pont erről szólt, hogy hogyan lehet megállapítani, hogy milyen tételek hasznosak egy másik tétel bizonyításához. Szóval a tudomány ebből a szempontból könnyebb dió, mint a művészet, már csak azért is, mert egy kutatónak más a motivációs rendszere. Az emberi tudás gyarapítása a célja, és ha korrekt módon hivatkoznak a munkájára, akkor nem lesz baja.
– A Google miért finanszíroz egy ilyen kutatást? Piacosítható terméket akar belőle csinálni vagy csupa szívjóságból szintén az emberi tudás gyarapítása a célja?
– Szerintem mind a kettő. A Google rengeteget publikált, többet, mint sok egyetem együttvéve, és mások ezeket az eredményeket felhasználhatják. Sok módszer, amit publikáltam, jól ismert, sokan használják a Google-on kívül is. A cégnek ezekből nem származik közvetlen versenyelőnye, azon kívül, hogy ott kerülhettek először felhasználásra. Talán csak az, hogy szívesen jönnek ide az okos emberek dolgozni a világ minden részéből. Ugyanebből a célból számos ösztöndíjat is finanszíroz a Google Research, és jó kapcsolatot ápol az egyetemekkel, állami kutatóintézetekkel. Az is igaz, hogy amit csinálunk, alkalmas lesz arra, hogy javítsa a szoftverek biztonságát. Sok csoporttal együttműködünk a cégnél, és egyes részeredményeinket felhasználják a Google termékek javítására. A harmadik cél, hogy ha sikerül létrehoznunk egy univerzális érvelő rendszert, az mérföldkő lenne az MI történetében. Akkor olyan mesterséges intelligenciát lehetne csinálni, ami megbízható, nem hallucinál. És van hosszú távú memóriája is – a mai modellek például nem tudnak eltárolni információkat. A csoportom ezen is dolgozik.
– Az MI az elmúlt évben kuriózumból a fősodor részévé vált. Ez jó vagy kockázatos?
– Minden új technológiának megvannak a pozitív és negatív hatásai. Hogy mik lehetnek a pozitív hatások, arról már beszéltem, de ez nem jelenti azt, hogy a negatívakat nem látom. Például Amerikában a hitelminősítésnél már használnak MI rendszereket, vagyis úgy dőlnek el életbe vágó kérdések, hogy pontosan nem is látjuk át, mi alapján javasolta ezt vagy azt a rendszer. Ez például nem jó irány, de a pénzpiacokon is egyre inkább MI algoritmusok áraznak be cégeket, értékpapírokat. Erről lehet vitatkozni, hogy ez mennyire baj vagy jó. Én nem akarok ebbe belemenni, mert én magam sem tudom megítélni. Én azt tudom, hogy az emberek szeretnek jobban felháborodni látható trivialitásokon, mint olyan dolgokon, ami gyökeresen érinti az életüket, csak igazából senkinek nincs rálátása.
– Mit gondol azokról az apokaliptikus víziókról, hogy az MI a civilizáció végével fenyeget? Korábban Stephen Hawking, ma Elon Musk szokott például ezzel riogatni.
– Nekem is vannak gyerekeim, és ha meg lennék győződve arról, hogy az MI az a következő ötven-száz évben elpusztítja az emberiséget, akkor nem foglalkoznék ezzel éjjel-nappal. Akkor azzal foglalkoznék, hogyan lehet ezt megakadályozni. Érdemes gondolkozni ezeken a kérdéseken, de pánikolni szerintem korai. Sokan félnek például attól, hogy mi lesz, ha egy MI egy probléma megtalálásához extra számítási kapacitásra próbál szert tenni, és megkísérli átvenni az irányítást minél több hardver fölött. Ez elméletileg nem kizárt, de a mai rendszerek nem képesek rá.
– És mi lesz, ha majd a kritikus infrastruktúrák üzemeltetését bízzuk MI rendszerekre?
– Azok speciális célú rendszerek, és szigorú biztonsági szabályozásnak kell megfelelniük, ezért szerintem nem reális veszély. Az persze lehetséges, hogy megpróbálják majd emberek gonosz céllal kihasználni, és kiberterrorizmusra felhasználni. A neuronhálót át lehet verni, az egyik legtöbbet idézett eredményem például az, hogy egy kutyát ábrázoló képet meg lehet úgy változtatni, hogy az ember ne lásson különbséget, de a neuronháló macskát lásson benne. Nem lehet kizárni, hogy emberek próbálnak majd olyan MI-t létrehozni, amely kárt tud okozni, de ez ellen úgy tudunk védekezni, hogy erősebb MI-ket alkotunk, hogy ezt kiszűrjük.
– Mennyire tart attól, hogy az MI öntudatra ébredhet? Tavaly az egyik volt kollégája, Blake Lemoine ezt állította a Google nyelvi modelljéről, a LAMDA-ról, miután egy „beszélgetésükben” a gép nagyon meggyőzően érvelt amellett, hogy ő márpedig egy személy. A szakma egyöntetűen utasította vissza ezt. Ön mit gondolt?
– Gépi tanulással foglalkozó kutatóként pontosan tudom, hogy egy chatbot nem rendelkezhet olyan képességekkel, amiket Lemoine – aki egyébként nem szakember – beleképzelt. Ami érvelésnek tűnt, az valójában az interneten látott beszélgetésekből, cikkekből, könyvekből az adott témában összegyűjtött információk visszaidézése volt. Vagyis „kitalálta”, hogy reagálna egy sci-fi-beli, valóban tudatos MI bizonyos felvetésekre, kérdésekre.
– Laikus szemmel nagyon meggyőzően érvelt LAMDA.
– Laikus szemmel talán – már az egyik első chatbotról, a ’60-as években kifejlesztett ELIZA-ról is sokan azt hitték, hogy emberrel beszélgetnek, pedig csak 30-40 kérdésre tudott előre kitalált válaszokat adni.
Az embereket nem nehéz átverni, mert szeretjük készpénznek venni a dolgokat. Már több tízezer éve beleképzelünk emberi szándékokat a természet működésébe és előszeretettel antropomorfizálunk élettelen dolgokat.
Egyébként úgy gondolom, hogy még ha el is fogadjuk, hogy egy ilyen MI nyelvi modellnek kialakulhat valamiféle belső szubjektív tudatossága, azt akkor sem fogja tudni kommunikálni az emberek felé. Ugyanis az egyetlen kimenet, amire programozva lett, hogy kitalálja, a tréningadatok, az emberek által létrehozott internet alapján mi a legvalószínűbb szöveges válasz a felhasználó által feltett kérdésre. Tehát lehet, hogy az MI azt mondja, hogy szomorú, akkor még ha lehetnek is belső érzelmei (ezt nem tudjuk), akkor valószínűleg inkább vidám lenne, amikor sikeresen meg tudja jósolni azt, hogy a mondat folytatása „szomorú”.
– Elvileg el tud képzelni olyan MI-t, amely tudatos lehet? Például amin önök dolgoznak, ami mögött lesz valódi megértés és lesz hosszú távú memóriája is?
– Elvileg el tudom képzelni, de nagyon-nagyon szkeptikusnak kell lennünk. Én úgy indulnék el, hogy olyan hálózatokat hozok létre, amelyek nem láttak emberi szöveget, csak egymással kommunikálnak éjjel-nappal egy hermetikusan lezárt rendszerben. Ha sikerülne valahogyan dekódolnunk ezeket a „beszélgetéseket”, és azt látnánk, hogy az érzéseikről, preferenciáikról kommunikálnak, arra azt mondanám, hogy gyanús. De ezen a ponton már arról is beszélnünk kellene, hogy mit tekintünk öntudatnak általában véve, és erről mindenkinek más elképzelései vannak. Azt hiszem, a tudatos mesterséges intelligencia kérdésköre ma még inkább csak elméleti szempontból érdekes.
Nyitókép: Válasz Online/Vörös Szabolcs
Ezt a cikket nem közölhettük volna olvasóink nélkül. Legyen támogatónk a Donably-n, az új, biztonságos, magyar fejlesztésű előfizetési platformon. Paypal, utalás és más lehetőségek itt >>>